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A QUEM ESTE LIVRO SE DESTINA 


Os dois primeiros capítulos deste livro são puramente 
conceituais. Não tratam de tecnologia, nem demandam 
conhecimentos em programação, quaisquer que sejam. Eles se 
destinam aos que precisam entender o que é (de verdade) Business 
Intelligence (BI), do que ele é composto e o que esperar dele, por que 
implementá-lo e os desafios de um projeto de BI. 


Os demais capítulos discorrem objetivamente sobre o passo a 
passo para implementar uma plataforma de BI na íntegra, com 
exemplos, códigos, explicações e conceitos que lhe permitirão 
solucionar os cenários reais de sua empresa. Organizado dessa 
forma, este livro se destina a: 


Todos aqueles que estão com o clássico problema: 
“preciso melhorar as ferramentas de tomada de decisão 
da minha empresa! O que fazer?” 


Neste livro, definimos o que é Business Intelligence e para o que 
ele serve. Com esses subsídios, entender qual o momento de sua 
empresa e avançar nesse caminho se tornarão tarefas bem mais 
claras. 


Todos aqueles que já sabem o que fazer, mas ainda não 
têm ao certo o “como”. 


Cobrimos a criação de uma solução de BI desde a sua concepção 
até a disponibilização final das análises aos usuários em seus 
diferentes níveis! Trilhamos o caminho item a item, a fim de 
determinar o que fazer, independentemente de você seguir as 
tecnologias aqui empregadas ou outras similares. 


Todos aqueles que, conhecendo bem ou não os 
conceitos de BI, acreditam que é uma solução cara 
demais para sua empresa ou para seu momento. 


Sem o gasto com ferramentas e usando os recursos disponíveis 
em sua empresa, pode-se progredir muito em termos de soluções de 
tomada de decisão. Este livro guia os passos que lhe levarão do zero 
ao melhor uso de uma ferramenta gratuita e, ainda, com total 
possibilidade de evolução para as soluções pagas mais conceituadas 
do mercado! 


Todos os interessados em se aprofundar 
conceitualmente e tecnicamente em Business 
Intelligence. 


Se sua empresa investiu em um projeto de BI que se inicia, ou se 
você simplesmente está estudando o assunto, não deixe de ler este 
livro. Uma enorme quantidade de informação errada ou 
simplesmente tendenciosa bombardeia quem se embrenha nessa 
ciência. Este livro fornece fundamentos claros e isentos sobre o 
tema! 
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INTRODUÇÃO 


1.1 DEFININDO BUSINESS INTELLIGENCE 


Business Intelligence (ou BI) é um termo cunhado por Howard 
Dresner do Gartner Group, em 1989, para descrever um conjunto 
de conceitos e métodos para melhorar o processo de tomada de 
decisão das empresas, utilizando-se de sistemas fundamentados em 
fatos e dimensões. O BI baseia-se em agrupar informações de 
diversas fontes e apresentá-las de forma unificada e sob uma 
métrica comum, a fim de que indicadores aparentemente distantes 
possam fazer sentido entre si. 


Ou seja, BI é: 


“Uma metodologia pela qual se estabelecem ferramentas para 
obter, organizar, analisar e prover acesso às informações necessárias 
aos tomadores de decisão das empresas para analisarem os 
fenômenos acerca de seus negócios”. — Howard Dresner 


É interessante observar dessa definição que: 


e BI é uma metodologia, não uma ferramenta. Isso 
significa que se pode implementar BI com praticamente 
qualquer ferramenta de controle de dados, ou com o 
conjunto de quaisquer ferramentas próprias de BI, 
bastando conhecer a metodologia. 


Curiosamente, o que se vê no mercado é uma disputa 
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dos “players” alegando que suas ferramentas são 
melhores, que podem fazer isso ou aquilo e que os 
concorrentes deles não fazem. O interessante é que a 
gigantesca maioria das funcionalidades de uma 
ferramenta de BI são idênticas entre as opções de 
mercado. E mais curioso ainda é que, para uma 
implantação nova em uma corporação, nem metade 
dessas funcionalidades serão necessárias. 


Vamos discorrer um pouco mais sobre esse tema logo 
adiante, mas o diferencial entre as ferramentas pode ser 
algo necessário apenas quando um elevado nível de 
maturidade dos usuários é alcançado. Antes disso, o 
que se tem é preciosismo e argumentação vazia de 
venda. 


BI serve para analisar os fenômenos acerca do 
negócio. Isso significa que Business Intelligence precisa 
ser uma plataforma capaz não só de aglutinar as 
informações transacionais, mas também de exibi-las de 
forma contextual, fazendo com que fenômenos 
escondidos se tornem visíveis. Um exemplo bem 
acadêmico desse conceito é o indicador de faturamento. 


Imagine que o CEO de uma empresa receba a 
informação de que o faturamento do mês está abaixo 
do esperado. Essa informação por si só não indica a 
causa desse problema. 


Sem mais dados, esse CEO ligaria para o VP Comercial 
e descobriria que as vendas estão acima do previsto. Se 
estamos vendendo bem, por que não estamos faturando 
bem? Ele então ligaria para o VP de Produção e 
descobriria que a produção está exatamente na meta, 
tendo manufaturado todos os pedidos. Se vendemos e 
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produzimos, o que impede o cliente de aceitar o 
faturamento? Ligando para o CFO, ele seria informado 
de que as NFs foram emitidas, mas os clientes de uma 
determinada região estão negando o pagamento! 
Falando com o COO, ele é informado de que as 
entregas de uma região não estão ocorrendo, porque 
uma transportadora está em greve! 


Custo Médio 
Vendas 
Faturamento 





ET Norte 
Região Sul 380% _ Sul e 


Região Centro | 60% | 





9,00 10,0 
900 6,00 
m| 18,00 16,00 





Nesse exemplo, nota-se a importância não só de ter a 
informação, mas de tê-la de forma contextual, em 
conjunto com outras informações relevantes. O 
“fenômeno” nesse caso seria o impacto na meta de 
faturamento por conta de um fornecedor de transporte. 


Já dizia a máxima de que: 


“O conjunto de dados gera um registro, o conjunto de registros 
gera uma informação e o conjunto de informações gera o 
conhecimento!” — Autor desconhecido 
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Um CEO de posse desse conhecimento poderia facilmente 
promover uma multa ao fornecedor, a contratação de um backup de 
entrega etc. Enfim, o BI bem implementado deve buscar tornar essas 
relações facilmente visíveis e, mais do que isso, integradas aos 
processos da empresa e não de um indivíduo. Quando os 
fenômenos são mapeados e expostos pelo BI, eles deixam de ser de 
um único funcionário ou departamento, e passam a ser de 
propriedade da corporação. 


Mas, para se falar de Business Intelligence, precisamos 
conceituar alguns termos com os quais conviveremos daqui por 
diante. Vamos ter em mente que implementar uma solução de BI é 
criar uma arquitetura que poderá evoluir ao longo do tempo, de 
algo simples para uma solução extremamente “parruda” que 
permeará toda a organização e, por que não, muito mais além dela! 


O primeiro grande conceito é de que as informações do BI são 
cópias dos dados dos sistemas da sua empresa e, se necessário, de 
fontes externas. Mas o Business Intelligence, por definição, não deve 
gerar informações que não as de estatísticas sobre os dados 
importados das fontes chamadas transacionais. 


Ter “uma telinha” que insere dados diretamente na base do seu 
BI (que se chama Data Warehouse, como veremos) é algo 
academicamente bastante questionável e que eu recomendo 
fortemente que evitemos! Assim sendo, temos que: 


e Sistemas transacionais: sistemas em que as transações 
do dia a dia são geradas e atualizadas. São o ERP, o 
CRM, Sistema de pedidos, de chamados etc. Esses 
sistemas são chamados de OLTP (on-line transaction 
process). 


e Sistemas analíticos: é o seu Business Intelligence, que 
importa os dados dos transacionais e disponibiliza as 
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informações de forma que elas sejam analisáveis pelos 
usuários. Esses sistemas são chamados de OLAP (on- 
line analytical process). 


OBSERVAÇÃO 


Usualmente, usa-se o termo OLAP para definir apenas os 
bancos de dados multidimensionais (os chamados “CUBOS”, 


que comentaremos adiante) e não a plataforma toda de BI. Não 


vou entrar no mérito de certo ou errado de definições, mas não 
só de cubo vive a análise. 





Mas por que copiar os dados dos Sistemas 
transacionais? Eu não posso consultar diretamente 
deles? 


Essas perguntas são frequentes! Tão frequentes que alguns 
fornecedores de ferramentas de BI simplesmente pulam a etapa de 
copiar os dados, e passam a apresentar informações com leitura 
direta dos sistemas transacionais. Mas responder essas perguntas 
mostrará a fragilidade da abordagem desses “players”. 


Copiam-se os dados para uma base centralizada por 4 motivos 
principais: 


1. Os dados podem ser consultados sem atrapalhar o 
processamento diário dos sistemas transacionais: fazer 
consultas que somam históricos semestrais, anuais ou 
intervalos ainda maiores pode impactar na performance do 
sistema, ou encarecer sua infraestrutura para que seu 
hardware seja capaz de responder às consultas sem impactar o 
dia a dia. 
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Imagine parar o faturamento de uma empresa no meio do 
último dia do mês porque se quer saber como foi o 
movimento do ano passado! A carga dos transacionais para o 
analítico é feita em horário controlado e sempre do “delta”, ou 
seja, somente do que ainda não foi carregado. Geralmente, 
essas cargas se encerram durante a madrugada e não 
impactam nos processos produtivos. 


Os dados, ao serem copiados para uma base unificada, são 
validados: por passar por processos de carga periódicos (o 
chamado ETL que veremos adiante), os dados são 
previamente validados quando centralizados pela plataforma 
do BI. Se houver algum erro, uma lista de exceção é criada e o 
dado não é computado. Análises de erro são periodicamente 
executadas. Sem esse processo, erros de sistemas podem 
passar anos desapercebidos! 


Os dados colocados no BI passam a ser “eternos”: sistemas 
transacionais muitas vezes possuem rotinas de expurgo de 
dados a fim de garantir a performance. Se os dados estiverem 
na sua plataforma de BI, eles podem ser apagados dos 
transacionais sem problemas! Consultas comparando ano a 
ano desde a última década, por exemplo, podem ser 
executadas sem a necessidade de se retornar backup de 
arquivos mortos etc. 


Os dados de sistemas diferentes se tornam “próximos”: não 
é incomum você encontrar a mesma informação guardada de 
forma diferente em sistemas distintos. No sistema de 
Faturamento, você tem o Id cliente como numérico e, no 
CRM, você tem o CD CLI como texto. Ambos têm a mesma 
informação e tratam do mesmo cliente. 


Eventualmente, essas informações estão gravadas de forma tão 
distinta que, por exemplo, saber qual o faturamento do cliente 
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que abre mais reclamações pode ser algo bastante complexo! 
Ao unificar as informações em um local, essas consultas de 
dados de vários sistemas se tornam extremamente simples. 


Isto é, ferramentas que efetuam consultas diretamente contra as 
bases transacionais são interessantes pela velocidade com que são 
implementadas. Porém, por definição, não podem ser chamadas de 
ferramentas de BI. Quando muito, são ferramentas de relatórios. 


É interessante notar que essas ferramentas possuem um apelo de 
vendas muito forte e que, em demonstrações e reviews, são sempre 
bem cotadas. Isso porque elas têm a capacidade de exibir as 
informações oriundas dos transacionais de forma extremamente 
avançada e com apenas alguns cliques. Contudo, quando os 
usuários passam a estágios mais avançados do consumo de 
informações (conforme falaremos adiante, ainda neste capítulo), 
elas passam a gerar frustração. 


Plataforma de BI 
corretamente implementada 






Satisfação dos Usuários 


Ferramentas ligadas aos Transacionais 


Tempo 


A satisfação é gerada no momento em que se pergunta “Quais 
as informações?”. Essa resposta é dada rapidamente. Mas isso é um 
subset do que uma plataforma de BI pode fornecer, e a frustração 
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vem quando surge a pergunta “Qual a causa?”. 


Uma plataforma de Business Intelligence é implantada de forma 
mais lenta, e demora para atender a todos os usuários e gerar todas 
as informações. Mas, tendo sido implementada em sua totalidade, o 
BI sedimenta a satisfação dos usuários a cada nova implantação de 
origens de dados, porque atende aos requisitos de sua definição de 
analisar os fenômenos, às consequências (informações) e às causas 
(relações entre informações de toda a corporação). 


Uma vez que vamos centralizar os dados dos sistemas 
transacionais em uma única base de dados, por que não 
deixá-la preparada para responder às consultas da 
forma mais performática possível? 


E é exatamente isso que faremos! Ao criar uma base 
centralizadora, que receberá todos os dados da empresa, criaremos o 
chamado Data Warehouse, ou apenas DW! Teremos um capítulo 
adiante só sobre como ele é criado. Na minha opinião, este tema é a 
chave para o sucesso ou fracasso de uma implementação de BI. 
Desenhar um bom DW ou não será a diferença entre facilitar ou 
impossibilitar o dia a dia de quem usa e opera a plataforma de 
Business Intelligence. 


Uma boa referência bibliográfica nesse tema é o livro The 
Datawarehouse Toolkit, do professor Ralph Kimball. O que temos 
de saber por hora é que um Data Warehouse é formado por dois 
tipos de entidades e que elas permearão toda a relação que teremos 
com nosso BI: 


e O fato: fato, ou medida (measure), é toda informação 
que será matematicamente analisada. São as 
quantidades, valores, médias etc. Por exemplo: o total 
de vendas, a quantidade de chamados, a média de dias 
etc. 
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e A dimensão: é a informação pela qual analisamos os 
fatos, ou seja, as visões pelas quais veremos os números. 
Por exemplo, se formos analisar o total de vendas, 
faremos pelo quê? 

o Total de vendas por Mês; 

o Total de vendas por Mês; por Produto; 

o Total de vendas por Mês; por Produto; por Loja; 

o Total de vendas por Mês; por Produto; por Loja; 
por Vendedor; 

o E assim sucessivamente. 
Cada “por” que adicionamos à consulta é uma 
nova Dimensão. Quanto mais estratificarmos a 
informação, mais dimensões estamos adicionando 
à análise. 


Outro termo bastante importante é atência, ou seja, é o tempo 
de defasagem da informação. Dado que o BI precisa de um processo 
de carga que ocorre de tempos em tempos, a latência é o intervalo 
entre cada atualização. 


Para a boa parte das situações, a latência é diária. Isto é, o 
processo de atualização ocorre toda noite, tornando disponíveis as 
informações atualizadas até o dia anterior, o que se chama Latência 
D-1. Pode-se ter uma latência de algumas horas, com 
processamentos em intervalos menores do que um dia. Se formos 
efetuar cargas a cada 12 horas, por exemplo, a latência seria H-12. 


Disponibilizar os dados na plataforma de BI em tempo real, o 
“Real-Time BI”, é possível e, de alguma forma, até comum. O que 
se deve levar em consideração é que o processamento custa. Se 
formos fazer cargas em tempo real, o processamento — tanto dos 
transacionais quanto do BI — precisará suportar uma carga de 
trabalho considerável. E isso representa investimento, seja em 
hardware, ou em contratação de processamento para ambientes em 
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nuvem. 


Se haverá custo, temos de entender a necessidade de se ter 
sempre o último dado contabilizado em uma análise história! Será 
que, por exemplo, a venda feita nesse último minuto impactará a 
análise de um ano inteiro? Se não, os processos com maior latência 
são mais recomendados! 


Uma vez implementado, o BI será consumido pelos seus 
usuários. Algo óbvio, mas que engloba a que talvez seja a maior 
armadilha de todas! Consumir informações requer maturidade, 
treinamento. Isso mesmo, seu usuário precisa aprender a ter 
informações disponíveis. O entendimento do que deve ser entregue 
para cada usuário é de suma importância. 


Existem basicamente 3 níveis de usuários que devem ser 
atendidos e, para cada um deles, um modelo estrutural de 
informação: 


e Corporativo: são as visões mais aglutinadas, os KPIs e 
cockpits de dados agrupados. Geralmente, são os 
diretores e gestores que consomem essas informações. 


e Departamental: são os relatórios detalhados e as visões 
com pesquisas. São utilizadas pelos coordenadores e 
analistas que operam o dia a dia. 


e Pessoal: são as planilhas dinâmicas que geram análises 
precisas de dados. São usados pelos especialistas 
(independente da hierarquia) que buscam novas 
análises, novos fenômenos e relações. 


Falaremos ainda bastante sobre essas formas de apresentação. 
Mas o foco é entender que entregar uma planilha dinâmica para 
quem espera visualizar um cockpit, e vice-versa, é o caminho para 
fracassar a implantação do BI! 
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1.2 O PROJETO BUSINESS INTELLIGENCE 


Um projeto de BI pode ter três tipos de fracasso e, infelizmente 
para nosso mercado, esses fracassos são encontrados com mais 
frequência do que os sucessos. 


e O projeto todo foi abandonado — Não é incomum 
encontrar empresas que já tiveram iniciativas de BI no 
passado, mas abandonaram o projeto antes dele 
apresentar sequer alguma informação. As causas para 
esse tipo de fracasso são inúmeras, a começar por um 
time desqualificado para a implantação do BI até um 
cliente totalmente despreparado. 


e O projeto foi abandonado, mas existem usuários 
ativos — Esse problema é um pouco menos comum 
porque, tendo usuários ativos, geralmente opta-se por 
sofrer mais um pouco e terminar o que se começou. 
Mas já presenciei empresas que possuem BI atendendo 
a uma área e somente a ela, porque outras implantações 
foram proibidas. Pode-se imaginar o sofrimento e o 
custo dessa implantação para que se ter uma empresa 
inteira avessa à continuidade do que se começou. 


e A solução está em uso, mas gasta-se muito mais do 
que o necessário — Na minha opinião, esse é o pior 
tipo de fracasso. Isso porque é um fracasso disfarçado 
de sucesso. Os usuários estão felizes, e o fornecedor 
coloca orgulhoso o logo do cliente em suas 
apresentações institucionais. Porém, esse tipo de 
projeto fomenta as máximas de que “o BI é caro”, “eu 
não tenho tamanho para ter uma plataforma de BI” etc. 


Gasta-se milhões para se implementar o que milhares 
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resolveriam. Atualmente, são diversos “players” 
cobrando vultuosas somas para implantar aquilo que 
um ou outros softwares combinados fazem de graça e 
com mais poder! 


Mas ao se decidir por implantar uma solução de BI, 
independente de usando este livro como guia ou tendo comprado 
uma plataforma de muitos milhões, é preciso ter em mente os 
benefícios que ele trará. Parece mais uma afirmação óbvia, mas 
vamos mencionar algumas boas práticas nesse sentido mesmo 
assim. 


Quando uma empresa decide por investir em uma implantação 
de BI, geralmente algum problema está sendo apontado como 
“sponsor” da iniciativa. Por exemplo, pode-se implantar BI para que 
“um book informativo seja gerado instantaneamente, dado que 
atualmente se leva uma semana”. 


Nesse contexto, é interessante ter bem mapeado os benchmarks 
de como o processo era, quanto tempo ele levava e quanto custava e, 
se possível, qual a sensibilidade dele a erros de dados. Ao final da 
implantação, demonstrar os ganhos será fundamental para que a 
iniciativa cresça e alcance novas áreas e funções. 


Informação e conhecimento têm um efeito viral dentro das 
empresas. Quando um departamento tiver acesso a informações 
confiáveis e de forma instantânea, mais e mais demandas 
aparecerão. Manter o controle de como era o processo antes do BI e 
depois de cada uma dessas iniciativas dele é algo que historicamente 
se mostrou extremamente importante. A memória de quem paga a 
conta é, geralmente, bastante volátil. 
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Processo Demandante Objetivo Sensibilidade 










Criar o Book financeiro 
mensal 






Geração do Book Mensal EXTREMA 





















KPIs de Logística para 
acompanhamento diário 





Informativo de Romaneio Logística MÉDIA 
Mapa de eficiência de 


Campanhas 












Plano de MKT 















R$952,00 





R$952,00 





R$ 2.380,00 0 [o] | v02 R$ 2.380,00 


168h 1 R$ 5.600,00 80h 1 | R$2.560,00 | vo RS 2940,00 








3 
Versão TCO (12 meses) ROI (12 meses) SALDO 
v 01 R$ 20.000,00 R$ 11.424,00 -RS 8.576,00 
v 02 R$ 5.000,00 R$ 28.560,00 R$ 23.560,00 
ROI FINAL: R$ 14.984,00 
Versão TCO (12 meses) ROI(12 meses) SALDO 
v 03 R$ 36.920,00 R$ 35.280,00 -RS 1.640,00 
ROI FINAL: R$ 13.344,00 


Note no exemplo anterior (extraído de uma implantação para 
uma empresa de logística), que uma ou outra implantação sairia 
mais cara no primeiro ano do que o próprio projeto de BI. Isso é 
bastante normal principalmente para a primeira implantação que 
paga todo o “setup” do projeto. Contudo, mais e mais implantações 
e o decorrer dos anos provarão a viabilidade financeira do 
investimento, principalmente quando feito sem custo de 
licenciamento. 


Outro ponto é quanto à sensibilidade das informações: vimos 
uma vez que uma empresa de energia foi multada em alguns 
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milhões por fornecer dados incorretos ao ministério. Só essa multa 
pagaria toda a implantação de uma plataforma de BI que geraria as 
informações automaticamente e sem erros! Isso sem contar nos 
danos à marca. 


Uma vez feitos os levantamentos de demandas e feita a 
priorização de qual iniciativa será a primeira, e depois de se levantar 
o benchmark, inicia-se o projeto propriamente dito. Não vou me 
delongar em processos de gestão, mas uma das questões mais 
importantes de um projeto é o seu escopo. E definir o escopo de um 
projeto de Business Intelligence pode ser algo complicado. 


Por sua natureza, uma plataforma de BI deve permitir ao 
usuário a criação de suas próprias visões de dados, de seus próprios 
relatórios. Isso gera infinitas possibilidades de relatórios, de tabelas 
dinâmicas e gráficos. 


Então como contemplar tudo isso em um escopo e 
ainda evitar que se torne um “projeto infinito”? 


Existe um artefato que vem em nossa salvação! 


A Matriz de Fatos e Dimensões (ou MED) é um documento 
que rege o que cada implantação do BI vai conter e, de quebra, nos 
apresenta dados técnicos como a granularidade, fórmulas e origens. 
Todos esses termos serão cobertos em detalhes nos capítulos 
técnicos a seguir, mas para a boa gestão de um projeto de BI, deve- 
se, antes de iniciar o desenvolvimento, criar o mapa do que será 
entregue. Esse mapa é a MFD! 


Dimensão [BELE] Empresa 


La lise- ig edi Plid Data Composta) Ano Mês Dia Empresa | Nome 
Type Time Years | MonthoOfYear | DayOfMonth| Regular | DB STR 








Qtd Solicitação 
Aging (Dias) 
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Tomando por base esse exemplo, temos que a coluna Measure 
serão os Fatos que serão entregues e que as colunas ao lado (Data, 
Empresa, Diretoria, Gerência e Colaborador) serão as Dimensões. 


Os X são os cruzamentos oferecidos. No exemplo, 
mostraríamos quantas solicitações foram feitas e qual a idade em 
dias de cada uma delas, por data e para cada colaborador de cada 
empresa. E se seguíssemos a matriz, poderia haver Diretoria, 
Gerência, Departamento etc. 


Ao lado esquerdo de Measures , podemos ter informações 
técnicas (que cobriremos nos tópicos de ETL e de visualização, 
adiante). Junto a Dimensão , também temos algumas informações 
técnicas que servem para guiar o desenvolvimento. 


A princípio, se tivermos uma MFD apenas com o nome das 
Dimensões e das Measures, e os X representando o cruzamento 
entre elas, já temos o suficiente para a gestão de Escopo! 


Uma vez definidas quais informações estarão disponíveis, deve- 
se ater a como exibi-las informações e para quem. Conforme 
comentamos anteriormente nas definições sobre as visualizações, a 
entrega das informações da forma correta para o público correto é 
uma das maiores possibilidades de problemas que permeará a vida 
da plataforma de BI. 


Não obstante a esses entregáveis, um projeto de BI, como 
veremos a seguir, é feito pela implantação técnica de cargas, 
persistência e exibição, e também pela capacitação dos usuários. 
Principalmente em uma nova implantação, não espere que seus 
usuários saiam usando a plataforma sem nenhum problema! 


A nomeação dos Key users é extremamente importante. Eles que 
serão treinados e responsáveis por multiplicar o conhecimento em 
suas respectivas áreas. Seguindo as melhores práticas de gestão 
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pragmática, é bom manter os key users informados do andamento 
de todos os passos do projeto e, se possível, colocá-los junto do 
processo de desenvolvimento da solução. Essa prática agiliza o 
ajuste de detalhes e coloca-os juntos do time do projeto, tornando 
todos corresponsáveis pelas entregas. 


Uma vez que o BI esteja de fato entregando informações, é 
natural que os dados apresentados sejam confrontados com as 
formas anteriores de informações, ou seja, com as planilhas, books, 
e-mails etc. Por vezes as informações do BI serão postas à prova por 
conta de exibirem dados diferentes dos oriundos dessas fontes. 


Será natural no processo de estabilização da plataforma que, 
durante o desenvolvimento e a homologação, encontre-se erros no 
BI (no processo de carga, na exibição etc.). Contudo, à medida que 
esses problemas são ajustados, os erros estarão frequentemente nas 
fontes de dados originais. E não se engane: será missão dos 
implementadores do BI provar que o Business Intelligence está certo 
e que essas fontes estão erradas. E isso vai dar trabalho! 


Por esse motivo, um período bem “generoso” do cronograma do 
projeto deve ser direcionado para o Data Quality, processo no qual 
os dados do BI são confrontados com as antigas origens e um 
veredicto de qual fonte está correta deverá surgir. 


Por vezes, passei horas e horas analisando planilhas à procura de 
erros em fórmulas, dados copiados errados, e afins. Se formos criar 
um cronograma padrão (MS Project), recomendo que os seguintes 
itens — mas não só eles — constem em seu WBS: 


e Kickoff do projeto 
o Definir benchmark para ROI 
e Definir Sponsors e Power Users 
e Análise 
o Identificação dos requisitos de negócio e riscos 
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o Definir origens, qualidade e latência das 
informações 
o Definir regras de negócio corporativas e 
departamentais 
e Desenvolvimento 
o Data Warehouse (ou Datamart) 
a Desenho 
= Testes de Mesa 
= Implantação 
e Processos de Carga 
a Desenho e regras 
= Implantação 
o Relatórios e dashboards 
= Dashboard comercial 
= Relatório de apoio ao vendedor 
mo. 
o Data Quality 
a Validação dos dados aprensentados vs. 
Fontes anteriores 


1.3 POR QUE IMPLEMENTAR BI A CUSTO 
ZERO 


A resposta “para não gastar, oras” não cabe aqui. A máxima de 
que o barato sai caro geralmente é verdadeira para o mundo da 
Tecnologia da Informação. A resposta mais correta seria “para 
viabilizar, oras”. 


O Business Intelligence Maturity Model, concebido pelo The 
Datawarehouse Institute, é uma classificação referente a como uma 
corporação lida com a informação e com o conhecimento: 
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Se sua empresa não possui uma solução de Business Intelligence, 
é bem provável que ela se encontre entre os níveis Desavisado ou 
Tático. Ou seja, os dados estão espalhados em sistemas e em 
planilhas descentralizadas. Não é incomum dois departamentos 
chegarem a números diferentes para o que deveria ser a mesma 
informação. 


Quando se opta por implementar uma plataforma de BI, passa- 
se para o nível Focado, ou seja, a informação e o conhecimento 
passam a ter a mesma relevância que a operação do dia a dia. Só que 
isso ocorre geralmente em uma determinada área. Um sponsor que 
entende essa necessidade e que solicita a implantação do BI. Ele, 
inicialmente, estará sozinho nessa empreitada. 


Por isso que uma implantação a custo zero é 
importante 


Já presenciei iniciativas que nunca passaram do estágio de 
proposta comercial, porque a área demandante não possuía o 
budget necessário para, sozinha, pagar pelos servidores, 
licenciamentos e consultoria. Como outros departamentos ainda 
estavam em estágios iniciais, a iniciativa do BI não saia do mundo 
dos desejos de poucos usuários. 
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Contudo, imaginando que o BI simplesmente “aparecesse 
funcionando” para essa primeira iniciativa, ele rapidamente passaria 
a ser desejado por outros departamentos da empresa e novas 
implantações de dados e visões seriam solicitadas. E esse seria o 
caminho para que a empresa atingisse os níveis Estratégico e, quem 
sabe, Universal. 


O objetivo dessa implantação sem custos é o de, justamente, 
fazer a empresa dar os passos para o estágio Focado e, em certo 
nível, atingir o Estratégico. E esse é o segredo: 


Implantar uma solução gratuita que vai se pagar enquanto os 
usuários entendem o que é o Business Intelligence e o que ele 
pode oferecer, saindo assim do estágio Desavisado ou Tático e 
entrando no Focado. Mas também, implementar uma solução 
que seja facilmente transportada para uma arquitetura 
“parruda”, com infindáveis recursos quando a corporação 


amadurecer para o estágio Estratégico! 





Antes de haver necessidades reais que não são atendidas por 
uma plataforma gratuita, investir milhões em ferramentas pagas é 
um caminho perigoso. E se seu usuário nunca amadurecer a ponto 
de requisitar aquilo que só aquela ferramenta entrega? E se o budget 
for consumido no licenciamento e não no desenvolvimento? Que 
valor vamos entregar? 


E nesse ponto entra outra afirmação bastante recorrente quando 
falamos em implementar uma solução que não envolverá custo de 
licenciamento: 
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“É preferível uma solução mais profissional para a nossa 


necessidade...” 





Curiosamente, nada é mais amador do que usar o preço como 
fator decisório. 


Recentemente, li um artigo de um sommelier que listava 
excelentes vinhos a um baixo custo. Para conseguir fazer essa lista, 
ele precisou ter um grande conhecimento sobre o que compõe um 
excelente vinho e ter habilidade suficiente para identificar essas 
características. Eu, por outro lado, já presenteei alguns amigos com 
péssimos vinhos mesmo tendo optado pelas garrafas mais caras da 
adega. A diferença é que ele entende realmente de vinhos, e eu sou 
um grande amador no assunto. 


De forma análoga, ao optar por uma solução paga simplesmente 
por ela ser paga ou ser famosa, denota falta de conhecimento sobre 
o que cada ferramenta oferece e sobre quais são as reais 
necessidades de cada demandante. 


É claro que optar por soluções caras e conhecidas trará um 
conforto a quem está implementando o BI. Se tudo falhar, pelo 
menos a escolha foi a menos controversa possível. Já ouvi 
justificativas como “o que mais eu poderia ter feito? 
Implementamos a ferramenta mais cara do mercado!”. 


E o mais interessante é que os insucessos não ocorreram apesar 
da opção da ferramenta, mas por causa dela. 


1.4 CONCLUSÃO 


O que vimos até agora são as definições básicas de Business 
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Intelligence e um pouco dos motivos pelos quais devemos 
implementá-lo paulatinamente, bem como os desafios e soluções 
dos projetos de implantação de uma plataforma de BI. 


Nos próximos capítulos, entraremos no hands on. Vamos 
montar todo o ambiente necessário, e implementar a solução por 
completo! 


1.4 CONCLUSÃO 21 


CAPÍTULO 2 


ARQUITETURA E 
AMBIENTE 


2.1 ARQUITETURA DE UMA PLATAFORMA DE 
BUSINESS INTELLIGENCE 


Como vimos no capítulo anterior, uma plataforma de BI deve 
ser implementada paulatinamente. Entretanto, desde seu início, ela 
deve ter por definição a capacidade de crescer, de agregar mais 
ferramentas, mais dados, mais usuários e atender a mais e mais 
necessidades. 


Antes de entrarmos na tecnologia que suportará essa 
plataforma, vamos conhecê-la em mais detalhes afim de entender 
quais as preocupações que precisaremos ter em mente quando 
formos escolher essa tecnologia. No esquema a seguir, temos a 
plataforma de BI e seu encaixe dentro de uma corporação. 
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Árvore de decisão 


Note nos grupos mais à esquerda do esquema que temos uma 
série de possibilidades de origem de dados: 


e Sistemas corporativos: como vimos no capítulo 
anterior, são os Sistemas Transacionais, o ERP, o CRM 
etc. A captura dessas informações pode ser feita por 
acesso direto ao banco de dados dela, por meio de 
serviços ou APIs, ou ainda pela extração de dados em 
planilhas ou arquivos de texto. Ainda assim, são dados 
estruturados e, geralmente, de obtenção mais simples. 


e Informações não estruturadas: são informações não 
tabuladas. Podem ser e-mails, documentos ou dados 
espalhados por fontes externas. Por tratar-se de dados 
não estruturados, ou seja, com informações textuais 
sem um posicionamento predefinido, o uso dessas 
origens requer uma técnica específica. 
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NÃO CONFUNDA 


O fato de dados serem obtidos por fontes externas à sua 


empresa, como redes sociais ou sites de informações 
financeiras, entre outras, não configura um Big Data. 





ETL 


Para que os dados sejam levados da origem até a plataforma de 
BI, tem-se um processo de carga, chamado de ETL (Extract, 
Transform and Load, ou Extração, Transformação e Carga). Houve 
um tempo em que o termo era ETLM, em que o M remetia à 
Manutenção (Maintenance). 


Todavia, o termo extenso caiu em desuso e, hoje em dia, o ETL 
permeia o cotidiano das organizações quando o assunto é 
transportar dados de um ponto a outro. Tem-se uma série de 
ferramentas específicas para o ETL, como PowerCenter, Pentaho 
Data Integration, SQL Integration Services, e tantos outros. 
Contudo, veremos neste livro como fazer um processo de carga 
baseado em arquivos e em bases de dados bastante eficiente, sem o 
uso de nenhuma ferramenta específica. 


Desse modo, precisamos ter a metodologia bem sedimentada, a 
fim de aplicá-la corretamente: 


e Extract: é o processo de extração periódica dos dados 
das origens por meio da leitura de uma ou mais fontes 
de informação. Deve-se atentar para o fato de que essa 
periodicidade implica na latência da informação! Além 
disso, porque o processo de carga roda repetidas vezes, 
tem-se a necessidade de tratamento de erros e avaliação 
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de eventuais indisponibilidades. 


Em ferramentas específicas, todos os passos possuem 
logs e existem monitores de ocorrências. No nosso caso, 
nós mesmos implementaremos todos esses controles — 
e de uma maneira bastante simples. 


e Transform: é o processo pelo qual os dados são 
trabalhados, colocados sob um formato específico, 
validados mediante as regras de negócio, calculados etc. 
Novamente, as ferramentas de ETL possuem diversos 
componentes de transformação pré-programados, que 
são configurados para cada carga. No nosso caso, 
trataremos os casos mais frequentes em conjuntos de 
comandos que farão o mesmo trabalho de forma 
relativamente simples. 


Claro que, conforme a complexidade de cada 
necessidade, o trabalho de implementar essas cargas via 
codificação aumenta e, eventualmente, pode-se gerar 
custos com a necessidade de contratação de 
consultorias especializadas. Se a solução chegar a esse 
ponto, uma reavaliação deve ser feita a fim de se 
determinar se já não seria o momento para um upgrade 
da versão gratuita para a paga. Veremos mais sobre esse 
processo decisório. 


e Load: é a inclusão propriamente dita dos dados na 
plataforma de BI. A inclusão deve ser feita de forma 
incremental, pois, como veremos adiante, uma 
informação inserida não poderá sofrer alterações 
(existem exceções, mas por hora vamos nos ater à regra; 
mapearemos algumas exceções mais adiante). Isso 
implica em ter sempre a carga do chamado “delta”, que 
será a diferença dos dados entre a última carga e o 
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momento atual. 
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Veja o exemplo de um package do SQL Integration 


Services, que é um fluxo de carga dos dados com 
agregações, consumo de serviços, obtenção de dados de 
diversas fontes e a persistência na base desejada. Um 


package geralmente atende a todo o processo, desde a 
extração, a transformação até a carga. 


Data Warehouse (DW) 


Como mencionamos anteriormente, o Data Warehouse é o 


coração de sua plataforma de BI! Ele é um banco de dados relacional 


como qualquer outro dos sistemas transacionais (servido pelos 
SGDBRs de mercado, tal qual o SQL Server, Oracle, DB2 etc.). 
Contudo, ele é desenhado para responder às pesquisas da forma 


mais performática possível. 


Em bancos de dados Transacionais, temos de nos ater à díade 


clássica de que: se aumentarmos a performance para SELECT , 
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estaremos denegrindo a performance para INSERT , DELETE , 

UPDATE , e vice-versa. Nesse ponto, as chamadas formas normais 
nos dão um guia de melhores práticas de modelagem de dados a fim 
de atingirmos um bom equilíbrio dessa equação. No DW, também 
chamado de banco de dados dimensional (por ser desenhado 
baseado em dimensões, como vimos anteriormente), as formas 
normais são justamente o que temos de evitar. Devemos desenhá-lo 
de maneira “desnormalizada”. 


Além disso, nossa base de dados centralizadora deve ser capaz 
de receber novas informações sem prejudicar as informações 
existentes. Ou seja, se já temos nela os dados do sistema de 
faturamento, devemos ser capazes de incluir os dados do CRM sem 
alterar o que já foi criado e, mesmo assim, deve-se poder relacionar 
as informações de ambos os sistemas! 


O que, à primeira vista, pode ser extremamente complexo de se 
atingir, foi postulado em 1993 por W. H. Inmon, definindo assim 
como deve ser um Data Warehouse: 


« 


ata Warehouse é um conjunto de dados orientado por 
assunto, conciso e integrado, variável com o tempo e não 


volátil.” 





Entendendo cada uma dessas 4 propriedades: 


e Orientado por assunto: isso significa que teremos de 
desenhar nosso banco de dados dividindo os assuntos 
em entidades que serão as chamadas dimensões. Por 
exemplo, se houver uma informação relacionada a 
Empresa, precisaremos ter uma tabela — e somente 
uma — que responderá por todos os atributos da 
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28 


dimensão Empresa. Esta deverá ser vinculada a todas as 
tabelas de Fatos (como vimos, de dados que podem ser 
matematicamente trabalhados) que possuem alguma 
relação com essa dimensão. 


Dessa forma, quando novos fatos forem acrescentados, 
bastará inserir a informação de Empresa — e das 
dimensões existentes — a fim de se possibilitar o 
cruzamento desses novos fatos com os já existentes. O 
DW poderá crescer indefinidamente. 


Conciso e integrado: significa que todo o dado 
inserido no DW deverá estar correto. Parece óbvio, mas 
nesse ponto reside a maior complexidade: definir as 
regras corporativas de cálculo, de origens e de 
validações. Em alguns casos, departamentos diferentes 
possuem regras diferentes para o que seria a mesma 
informação e, academicamente falando, deve-se chegar 
em um consenso para a inclusão do dado no DW. 


Já vivenciei situações em que esse consenso se mostrou 
impossível e tivemos de criar um Fato para cada 
departamento: Idade Estoque Produção e Idade 
Estoque Expedição. Os dois números deveriam ser 
iguais, mas por diferenças entre os entendimentos de 
cada departamento, geravam ligeiras diferenças entre 
eles. Como não se chegou em um acordo, precisamos 
optar por essa solução não muito ortodoxa. De 
qualquer forma, o modelo de dados se manteve correto, 
dado que cada uma dessas medidas era concisa com sua 
regra específica. 


Além disso, os dados são uniformizados. Informações 
idênticas podem ter formatos e máscaras distintas em 
diversos sistema. Ao inserir esses dados no DW, eles 
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devem assumir um formato padrão único, e assim 
permanecer. 


e Variável com o tempo: talvez seja esse o ponto-chave 
do DW. Sempre, invariavelmente e de qualquer forma, 
as informações devem ser posicionadas no tempo. Por 
mais que não exista nenhuma outra dimensão no seu 
DW, a dimensão temporal deve estar lá! Quando se faz 
a carga de valores de venda, por exemplo, precisa-se ter 
o dado de quando essa venda ocorreu mesmo que 
nenhuma outra informação seja carregada. E se por 
algum motivo estivermos carregando um dado que não 
possui informação sobre temporalidade, a data em que 
ele está sendo carregado no DW será a pontuação 
temporal dele! 


Isso garante a universalidade dos cruzamentos de 
dados. Se toda e qualquer informação for relacionada 
pela dimensão temporal, todas elas terão um ponto de 
cruzamento. Por exemplo, ao implantarmos uma 
plataforma de BI em uma grande indústria do setor de 
peças automobilísticas, cruzamos os dados do Sistema 
de Facilities (controle de manutenções prediais etc.) 
com o de Enfermaria (exames admissionais, 
atendimentos de funcionários etc.) e notou-se que, nos 
períodos em que mais chamados de manutenção 
apareciam, também mais notificações de afastamento 
por acidente de trabalho ocorriam. Resultado: criou-se 
uma política de manutenções preventivas para baixar a 
ocorrência de afastamentos. Um “fenômeno” entre 
duas áreas completamente distintas que foram 
aproximados pela dimensão temporal. 


e Não volátil: conceitualmente simples, esse ponto roga 
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que, quando um dado é inserido em seu DW, ele se 
torna imutável! Não pode ser apagado, não pode ser 
atualizado! Isso porque, se for diferente, as informações 
do passado podem apresentar diferenças quando 
consultadas em momentos diferentes. Tudo bem que 
nosso futuro é incerto, mas ter incertezas no passado é 
algo que denigre a confiabilidade de qualquer 
informação. Contudo, existem leves exceções. 


Vamos ver no modelo do nosso DW adiante que pode 
haver a necessidade de alterarmos “flags” em 
determinadas dimensões, de alterarmos um valor 
totalizador etc. Ter alterações extremamente 
controladas e com motivos bastante claros é permitido, 
mas temos de ter em mente que essas alterações não 
podem, de forma alguma, mudar as informações que o 
BI apresentará! Por essas especificidades que esse ponto 
é conceitualmente simples, mas de implementação que 
pode se tornar ligeiramente complexa. 
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Nessa figura, vemos a diferença entre o desenho de um banco de 


dados relacional, com suas tabelas normalizadas e de um banco de 
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dados dimensional, dividido entre fatos e dimensões. 


Cubos 


Se o DW é uma base de dados comum, um SGDBR como o seu 
transacional, já os cubos são outra coisa. Apesar de não tratarmos 
deles na implementação deste livro, vamos sim conceituá-los por se 
tratarem de um ponto que pode ser o maior incentivo para 
mudarmos da plataforma gratuita para a paga. 


Os cubos são alternativas para os bancos de dados relacionais, 
ou ainda dimensionais, como chamamos o DW. São banco de dados 
multidimensionais que suportam análises dinâmicas e consultas 
extremamente complexas com baixo tempo de resposta. 


Os SGBDM (Sistemas de Gerenciamento de Banco de Dados 
Multidimensionais) são ferramentas que pré-processam as 
agregações de dados, deixando informações prontas de todos os 
cruzamentos possíveis, a fim de que seja dada resposta instantânea à 
consulta do usuário. Da mesma forma que temos diversas 
tecnologias de SGDBRs, temos diversos SGDBMs como o SQL 
Analysis Services, IBM Cognos, SAS etc. 


Os cubos são formados por um mapa de acesso, informações 
detalhadas e valores agregados, sendo possível criá-los em 
principalmente três tipos, conforme o esquema seguinte: 
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Componentes de um Cubo 





e MOLAP (Multidimensional OLAP) 
o Dados e agregações armazenados no cubo 
o Boa performance de processamento 
o Maior consumo de espaço 
ə ROLAP (Relational OLAP) 
o Dados permanecem no relacional 
o Agregações são armazenadas no relacional 
e Pior performance de consulta 
e Pior performance de processamento 
o Maior carga de processamento para o DW 
e Dados real-time 
e HOLAP (Hybrid OLAP) 
o Dados permanecem no relacional 
o Agregações no cubo 
Melhor tempo de processamento 
Performance média de consultas 
Menor consumo de espaço 
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Como não vamos implementá-los, não vamos entrar em 
extremos detalhes sobre os cubos. Porém, vale mencionar que, se 
um DW estiver com um tempo de resposta muito alto (mesmo 
utilizando as ferramentas de exibição que usarão processamento 
local, como veremos adiante), os cubos se farão necessários. 


Vale lembrar de que, além do custo de licenciamento da 
plataforma paga a fim de se obter essa tecnologia, a implantação de 
um SGBDM por si só implicará na aquisição de hardware (eles 
consumirão um enorme processamento e uma grande quantia de 
disco). Não só isso, mas costumeiramente são mais caros os 
profissionais qualificados para trabalhar com a criação dos cubos, 
MDX (MultiDimensional Expression, que é a linguagem de 
consulta aos cubos), manutenção de acessos e demais necessidades 
para o bom uso dessa tecnologia. Ao optar pela implementação de 
soluções multidimensionais, tenha em mente que seu TCO vai 
subir, e que a necessidade real deles deverá estar bastante bem 
mapeada! 


Exibição 


Uma vez que tenhamos os dados corretamente disponíveis em 
nosso DW (e em nossos Cubos, se for o caso), podemos exibi-los 
para os usuários. Existem cada vez mais formas de apresentar 
informações, mas vamos cobrir as mais comuns (que resolvem 90% 
das necessidades) e que serão as cobertas na implantação deste livro: 


e Relatórios: sem dúvida, a forma de apresentação mais 
conhecida, o relatório é uma formatação predefinida de 
colunas que apresenta registros (linhas) de acordo com 
os filtros de uma seleção. Não é incomum esses 
relatórios apresentarem centenas e até milhares de 
linhas. São usados para acessar informações mais 
detalhadas e, em geral, não se relacionam com 
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informações de outras fontes. Ou seja, um relatório 
chamado Vendas apresentará todas as vendas 
(registro a registro) de um determinado intervalo de 
tempo pela loja, pelo produto etc. 


AR La~ Sales Order 
ADVENTURE KOKS a aê DISIR SHINI 
cyclea 














RiTo: Central Discourt Store SapTo Central Discount Storo 
259626 Russell Rd South 259826 Russet Rd Seui 
Kent Washingtoe 98031 Kant, Nachingion 98034 
Unted States Umted States 
Lomeci: Jean handay Purchasing Manager 5825550113 
Canna Stanev Purchasing Agent 597-555-0109 
Dae Order Dato Saos Person Ourctase Order Shipmani Molhos 
312009 612003 Dawa Campoli, Saes Representative POT192170677  CARGOTRANSPORT 5 
740.556-0182 
Luma Qty item Number Descrigtos Trackng a Una Price Subantal Disesunt tom Total 
1 2 CAs09a ANC Laço Cap 373D.4170.4E 5519 suy so09 s1037 
2 4 GLENOM FulktingarGinwes M 3730-4 17C-AE 52279 59118 5000 59118 
3 4 LENNIDL  LonpSicereLOGOJBISEVL  II041CAE 52884 s1193 s00 s123 
4 3 GLIH FulkfingsrCioves L WIDHITCAE $2279 s03 $0.00 $38.38 
S 1 BR-M6GB42 Mountain-200 Black 42 37304170A 5122945 122945 5000 122945 
g 1 TOMODIL Womose Tighis L 3720 4170 AE 54400 5.409 50.00 Sitoo 
7 1 BK-M68S.35 Mountain-200 Siver 38 3730-417C-AE $1.24285 8124285 $000 $1242 85 
Total Discount $0.00 Totat 8280260 


Contact os: 
e Phone: EOM-ADVENTURE 
* Email: help@adenturtwerka com 
e Fax 800-555-2424 


Nesse exemplo (Adventure Works é uma empresa 
exemplo da Microsoft para estudo das ferramentas), 
vemos um relatório bem detalhado sobre uma ordem 
de venda específica. 


e KPI e Dashboard: é bem provável que, mesmo sem 
nunca ter trabalhado com BI, você já tenha tido contato 
com o termo KPI. O Key Performance Indicator (ou 
Indicador Chave de Performance) é um conceito 
bastante difundido e muito útil. 


Ele parte do princípio de analisar uma informação sob 
a comparação de outra informação. Ou seja, estabelece- 
se um objetivo e se compara o realizado a esse objetivo, 
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indicando assim se a performance foi boa, média ou 
ruim. 


Por exemplo, podemos dizer que nosso alvo é vender 
nesse ano 10% a mais do que vendemos ano passado. 
Temos então uma meta. Se eu avaliar as vendas desse 
ano, poderei dizer se estou na Meta, acima ou abaixo 
dela. Com isso, posso criar indicadores visuais para 
determinar a minha situação, os chamados “faróis”. 


Contudo, como vimos no exemplo do “Indicador de 
Faturamento”, nada melhor do que apresentarmos uma 
informação em conjunto com outras informações a fim 
de obtermos o conhecimento! Quando temos diversos 
KPIs em conjunto, ditando uma correlação significativa 
entre eles, temos então o Dashboard ou Cockpit. Não é 
incomum em um Dashboard, unirmos os KPIs com 
gráficos e pequenas tabelas de detalhamento. Tudo o 
que permitir melhor entendimento dos fenômenos é 
bem-vindo. 













hd Total sales MTO Sales 





usLastYear JOrder ter Qty MTO Qty vslastr es Sales 
= Australia X 3 
North Sydney — ma $10,586.52 E 
silverwater $12,591.85 =j 
Melbourne — pe 98 $15,814,770 E 
Findon SAS: $2,991.62 [Z 
Hervey Bay SOS $15,210.03 E 


Goulburn BE 23046 $22,954.75 == 39 
Melton ES 2o49 $10,870.30 E 1 25 
Geelong | $142.97 $9,957.85 Rmi 25 
Sunbury l $125.57 $13,098.81 EB 27 
Rockhampton | $74.48 $5,773.11 =: 15 
Coffs Harbour | $53.97 $8,722.48 EE: s1 


e Tabela dinâmica: focada na possibilidade do usuário 
criar suas próprias análises, a tabela dinâmica permite 
que o usuário escolha quais fatos e quais dimensões 
serão exibidos e em que ordem, com que regra de 
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cálculo e com quais filtros. Pode-se facilmente incluir 
uma dimensão arrastando-a para a tabela, bem como 
mudá-la de linha para coluna com o mesmo processo 
de arrastar e soltar (o chamado slice and dice). 


As informações também podem ser exibidas de forma 
sumarizada ou detalhada, apenas clicando-se sobre o 
dado. Essa possibilidade de ir do mais sumarizado para 
o mais detalhado é o chamado drill down. O caminho 
inverso, do mais detalhado para o mais sumarizado, é o 
drill up. O interessante dessas visões é que, com alguns 
“cliques”, pode-se gerar comparações de dados 
completamente novas e infinitas combinações de 
visualizações! 





Tota Gessi BS ALETAN N$ POSSAS RS GM TOLOS RE USAS US GLASS AM RS ALPITA 


Conforme a figura, vemos uma tabela dinâmica do 
Excel sendo apresentada em conjunto com um gráfico 
dinâmico. Na implementação que faremos adiante, 
veremos como criar essas estruturas de forma bastante 
simples. 


Decision Tree e ações 


Academicamente, o BI não responde por efetivamente tomar 
ações. Ele entrega a informação certa para que melhores ações sejam 
tomadas. 
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Contudo, temos apresentações de dados contextualizados. 
Temos os KPIs, por exemplo, que indicam se uma situação é boa ou 
ruim por meio de comparações entre dados realizados e metas 
estabelecidas. Se a plataforma é capaz de definir se algo é bom ou 
ruim mediante parâmetros estabelecidos, podemos criar ações 
baseadas nessas situações a fim de agilizar procedimentos 
padronizados. 


Por exemplo, tem-se em SRM (Social Relationship 
Management), a coleta de informações de comentários de clientes 
nas redes sociais acerca de sua marca. Pode-se contextualizar esses 
comentários como positivos, negativos, entusiastas etc. Uma vez 
categorizado, pode-se ter rotinas que executam a inclusão de 
respostas automáticas a comentários negativos afim de se diminuir 
o impacto deles nas redes sociais. Ou ainda, em medições 
geotécnicas, pode-se estabelecer que o BI envie alertas quando uma 
determinada medição indicar uma movimentação de terreno maior 
do que a prevista, e assim por diante. 


2.2 A TECNOLOGIA ESCOLHIDA E A 
MONTAGEM DO AMBIENTE 


Se avaliarmos o mercado, veremos soluções gratuitas de 
Business Intelligence de diversos fornecedores, para diversos fins. 
Desde soluções nativas gratuitas, até BI como serviço, passando por 
versões gratuitas de ferramentas pagas. 


Atualmente, o mercado é bem farto de opções, o que, para quem 
vai iniciar uma empreitada de escolha, pode ocasionar um grande 
trabalho! Trabalho bom, claro, pois ter opções é sempre melhor do 
que não as ter. 


Mas o fato de iniciar a implantação da plataforma de Business 
Intelligence em sua empresa com uma solução não licenciada torna 
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tudo mais fácil! O ponto é determinar qual ferramenta. Para avaliar 
com quais soluções poderíamos trabalhar, levei em consideração os 
seguintes pontos: 


e Se são gratuitas, ou seja, não requerem licenciamento. 
Todo o budget que você tiver para essa iniciativa será 
revertido em entregáveis, em valor agregado. 


e Se são padrão de mercado, isto é, havendo a 
necessidade de ajuda, os profissionais de mercado aptos 
a trabalharem com elas são facilmente localizados e, por 
isso mesmo, não são muito caros. 


e Se são escaláveis para soluções pagas, ou seja, na 
ocasião do amadurecimento dos demandantes, a 
ferramenta gratuita pode ser facilmente migrada para 
sua versão paga e completa, possibilitando o 
crescimento sem a necessidade de “refatoração”. Além 
disso, os componentes expostos aos usuários 
continuam sendo os mesmos, isto é, a versão paga da 


ferramenta não gera necessidade de novos 
treinamentos. 


Dessa forma, optei pelo Microsoft SQL Server 2014 Express. 
Dentre as opções gratuitas, com certeza não é a que possui mais 
recursos. O Pentaho, por exemplo, é bem mais completo. Mas, se 
sua plataforma for evoluir em tamanho, funcionalidades e 
quantidade de usuários, as soluções de BI da Microsoft estão hoje 
entre as mais interessantes do mercado. 


Então, nada melhor do que começar com a versão gratuita de 
algo que pode ser migrado para uma versão completa e, assim 
sendo, fará frente a qualquer outra ferramenta como IBM, SAS, SAP 
etc. Além disso, e muito importante, é o fato de que SQL Server é 
padrão de mercado. Mais do que qualquer outro SGDBR, inclusive 
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Oracle, o SQL está difundido 
oferta de mão de obra. 
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Notamos pela dispersão 


As of October 2015 


(fornecida pelo Gartner), que a 


Microsoft, com seu SQL Server, se posiciona como o extremo do 


chamado “quadrante mágico”. 


Ou seja, é a solução mais completa e 


difundida no mercado até agora. 


Partindo da escolha do SQL Server, temos de avaliar seus pré- 
requisitos para a montagem do ambiente: 


e Sistema operacional compatível: Windows 7 Service 
Pack 1; Windows 8; Windows 8.1; Windows 10; 
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Windows Server 2008 R2; Windows Server 2008 R2 
SP1; Windows Server 2012; Windows Server 2012 R2. 

e Processador: processador compatível com Intel, com 
velocidade mínima de 1 GHz ou um processador mais 
rápido. 

e RAM: mínimo de 512 MB para o SQL Server Express 
com Ferramentas, e o SQL Server Express com 
Advanced Services e 4 GB para o Reporting Services 
instalado com o SQL Server Express, com Advanced 
Services. 

e Espaço em disco rígido: 4,2 GB de espaço em disco. 


Parto do princípio que, pelo menos, um servidor Windows está 
rodando em sua empresa e que poderemos usá-lo para essa 
empreitada — lembrando de que esse servidor não pode ser um 
controlador de domínio. SQL Express não pode ser instalado no seu 
AD Server. Se não houver nenhum, avalie a possibilidade de 
aquisição. 


Se não for possível comprar um server, veja que o SQL Express 
pode ser instalado em versões desktop do Windows que, 
obviamente, não são nada recomendadas para fazer de um servidor 
às vezes. Mas, claro, que se nada mais for possível, melhor 
implementar sua plataforma de BI em um desktop, e depois solicitar 
o budget do servidor quando os usuários começarem a reclamar de 
lentidão. 
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DISCLAIMER 


Se sua empresa não possuir nenhum servidor, avalie também a 
aquisição de soluções em cloud, tanto para Servers quanto para 


seu BI propriamente dito. Claro que essas opções são pagas, 


mas o TCO de ambientes e soluções em Cloud tem se 
mostrado menores do que seus similares físicos. 





No nosso exemplo, usaremos uma Máquina Virtual com 
Windows Server 2012 R2. Mesmo que você use versões anteriores 
do SO para o SQL Server 2014, tenha certeza de ter instalado o .Net 
framework 3.5 SP1. Ele é pré-requisito para a instalação que 
faremos a seguir. 


Resolvido onde instalaremos o SQL, temos agora de obtê-lo! 
Para isso, basta entrar no site do produto 
(https://www.microsoft.com/pt-br/download/details.aspx? 
id=42299) e efetuar o download, precisando de um breve cadastro 
para isso. 
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EB Microsoft 


Profile Center 








Home My profile Manage communications Help 


SQL Server 2014 Express 


Thank you for taking the time to fill out the following online form. |f you do not want to submit your 
information, click Cancel. 


* Indicates a required field 
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* My name (personal information) 


* Firstname Ronaldo 


* Last name Braghittoni 


* My email address 


braghittonidoutiook.com 


F Please select the version of SQL Server 2014 Express you'd like to download 


j SQL Server 2014 LocalDE Express 32bit 

SQL Server 2014 LocalDB Express 64 Bit 

SQL Server 2074 Express 32 Bit 

J SOL Server 2014 Express 64 Bit 

SOL Server 2014 Express with Tools 32 Bit 

D SOL Server 2014 Express with Tools 64 Bit 

O SQL Server 2014 Management Studio Express 32 Bit 
O SQL Server 2014 Management Studio Express 64 Bit 
CO SQL Server 2014 Express with Advanced Services 32 Bit 
© SOL Server 2014 Express with Advanced Services 64 Bit 


000004 
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* Please select the language of your SQL Server 2014 Express w/Advanced Servies 64 Bit 
download 


s) 


Chinese (Simplified) 
Chinese (Traditional) 
English 

French 

German 

Italian 

) Japanese 


OOo 


ç 


Q 


e: 


O Korean 
(6) Portuguese (Brazil) 
O Russian 
O Spanish 


= Country/Location 


Brazil 


To subscribe, select the communication(s) below and your preferred delivery format (HTML or 


Text). 
Format 
Subscribe HTML/Text Communication Description 
E So El TechNet Flash (US, XXO 


Communication preferences 


Choose how Microsoft may use your contact information. Please note: these settings may not refiect your 
current permission settings in our systems, Review your settings, 


I would like to hear from Microsoft about E would like ta hear from Microsoft Partners, or 

products, services, and events, including the latest Microsoft on their behalf, about their products, 

solutions, tips, and exclusive offers. services, and events. Share or use my details with 
Microsoft Partners. 

My email address El My email address 

ClBusiness hone number Cl Business phonenumber 


Note: These settings will not affect other newsletters or mandatory service commuricatioris from 
Microsoft, To leam now to set your contact preferencas for other Microsoft sites, read the privacy 
statement. 


By Downloading SQL Server 2014 Express software. you may receive emails from Microsoft with SOL Server 





2014 Express resources. 
Selecione a última versão disponível, e opte por ...With 


Advanced Services . À opção por 32 ou 64 bits dependerá do 
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Sistema Operacional do seu Servidor. Quanto à língua, recomendo 
usar a versão de sua língua local, a menos que sua empresa trabalhe 
com escritórios em outros países — quando então a língua padrão 
da corporação pode ser a melhor escolha. 


Ferramentas de Aplicativo 


Início Compartilhar Exibir Gerenciar 





o B + Meu computador » Downloads vė Pesquisar Downloads Pad | 





Hr Favoritos Nome Data de modificaç.. Tipo Tamanho 


EE Área de Trabalho [HA SQLEXPRADV x64 PTE 13/05/2016 15:46 Aplicativo 1.219.907 KB] 
B Downloads 


&) Locais recentes 








jE Meu computador 
= Área de Trabalho 
É Documentos 
($ Downloads 
Ê Imagens 
p Músicas 
E Vídeos 
i Disco Local (C:) 


Giu Rede 


Titem 1 item selecionado 1,16 GB 





A versão 2014 do SQL Server Express With Advanced Tools 
vem em um arquivo compactado de 1GB de tamanho. Clicando 
duas vezes no arquivo, ele iniciará a descompactação e o instalador: 
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Planejamento saf Nova instalação autônoma do SQL Server ou adicionar recursos a uma instalação 


- existente 
j Inicie um assistente para instalar o SQL Server 2014 em um ambiente não clusterizado ou 
Manutenção para adicionar recursos a uma instância existente do SQL Server 2014. 


Ferramentas Atualizar do SQL Server 2005, SQL Server 2008, SQL Server 2008 R2 ou SQL Server 2012 


Recursos Inicie um assistente para atualizar o SQL Server 2005, SQL Server 2008, SQL Server 2008 R2 
ou SQL Server 2012 para SQL Server 2014, 
Opções 


Microsoft SQL Server 2014 





Selecione a opção de Nova instalação autônoma, e depois aceite 
os termos da licença e clique em avançar : 
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Termos de Licença 


Para instalar o SQL Server 2014, você deve aceitar os Termos de Licença para Software Microsoft. 


Termos de Licença 

Regras Globais 

Microsoft Update 
Atualizações de Produto 
Instalar Arquivos de Instalação 
Instalar Regras 

Seleção de Recursos 


Regras de Recurso 


Regras de Configuração de Rec... 


Andamento da Instalação 


Concluída 





TERMOS DE LICENÇA PARA SOFTWARE DA MICROSOFT 
MICROSOFT SQL SERVER 2014 EXPRESS 


Os presentes termos de licença constituem um acordo entre a Microsoft Corporation (ou, 
dependendo do local no qual você esteja domiciliado, uma de suas afiliadas) e você. Leia-os 
atentamente. Eles se aplicam ao software acima identificado, que inclui, se houver, a mídia na 
qual ele está contido. Os termos também se aplicam aos seguintes itens da Microsoft: 


{v 


PEP E Ae 


=3 
Copiar Imprimir 





Aceito os termos da licença. 





Ative o Programa de Aperfeiçoamento da Experiência do Usuário e o Relatório de Erros para ajudar a 











melhorar a qualidade, a confiabilidade e o desempenho de softwares e serviços do Microsoft SQL 





Server 2014. 
onsulte a Política de Privacidade do Microsoft SOL 2014 para o mais informações. 


* O Microsoft SQL Server 2014 também inclui um componente do Visual Studio que terá as 
configurações de Programa de Aperfeiçoamento da Experiência do Usuário desativadas por padrão. Se o 
Visual Studio for instalado, esse componente usará as configurações de Programa de Aperfeiçoamento 
da Experiência do Usuário para Visual Studio. 

















Avançar > Cancelar 








Depois o instalador abrirá a Seleção de Recursos . Selecione 


todos os recursos, inclusive as ferramentas administrativas. Em um 


ambiente de alta performance, é recomendado instalar somente os 


serviços, sem as ferramentas administrativas e somente os serviços 


estritamente necessários (no nosso caso, a replicação não seria 


necessária, por exemplo). 


Contudo, vamos simplificar a instalação, selecionando as opções 
padrão. Para mais detalhes da instalação do SQL Server, procure a 


documentação do fabricante, em https://www.microsoft.com/pt- 


br/server-cloud/products/sql-server/features.aspx/Overview.aspx/? 
WT.srch=1&W'T.mc ID=N1IZzdQIx. 
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Seleção de Recursos 


Selecione os recursos Express a serem instalados. 


Termos de Licença Recursos: Descrição do recurso: 








Regra Goud Recursos da Instância A configuração e a operação de cada 
Microsoft Update [V] Serviços de Mecanismo de Banco de Dados recurso de instância de uma instância do 
Atualizações de Produto [Vi Replicação do SQL Server SQL Server são isoladas de outras instâncias 
| ` r [M] Extrações Semånticas e de Texto Completo para Pesquisa do A Serve. As jnctâncias cla EA Seg 
instalar Arquivos de Instalação [oleoso Eneas tia podem funcionar lado a lado no mesmo 
x Recursos Compartilhados Pré-requisitos dos recursos selecionados: 
Seleção de Recursos [7] Conectividade das Ferramentas de Cliente — 
Regras de Recurso [9] Compatibilidade das Ferramentas de Cliente com Versões Ant) | Jé instalado: 
[Y] SDK de Ferramentas de Cliente pe 
[V] Componentes da Documentação PAE NE ai 
IW] Ferramentas de Geranciamento - Básicas A ser sadias, pelo as 

[V] Ferramentas de Gerenciamento - Completas À —— A 
Configuração do Reporting Ser... [X] SDK de Conectividade de Cliente SQL Requisitos de Espaço em Disco 
Regras de Configuração de Rec... [7 LocalDB 
Recursos Redistribuíveis 








Instalar Regras 














Configuração da Instância 





Configuração do Servidor 











Configuração do Mecanismo d... 











Unidade C: 3998 MB necessários, 88997 MB 
Andamento da Instalação disponíveis 


Concluída 














<| m 








Selecionar Tudo Anular Todas as Seleções 




















Diretório raiz da instância: C:\Program Files\Microsoft SQL Server\ 








Diretório de recursos compartilhados: CAAProgram Files\Microsoft SQL Server 




















Diretório de recursos compartilhados (x86): C:\Program Files (x86)\Microsoft SQL Server 











< Voltar Avançar > Cancelar 





























Estando todos os pré-requisitos instalados, o SQL vai solicitar 
que se dê um nome à instância. Por padrão, ele sugere SQLEXRESS . 
Mas como se trata de uma instância que hospedará um ambiente de 
BI, um nome mais significativo pode ser atribuído, como BIPRD, 
por exemplo (remetendo a ser o ambiente de produção do nosso 
BI). Se sua empresa já possuir um padrão de nomenclatura de 
instâncias, não haverá nenhum problema em segui-lo. 
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Configuração da Instância 


Especifique o nome e a ID da instância do SQL Server. A ID da instância se torna parte do caminho de instalação. 


Termos de Licença O Instância padrão 





Regras Globais 
Microsoft Update 


Atualizações de Produto 


(9) Instância nomeada: 








Instalar Arquivos de Instalação D dainstâniia: 











Instalar Regras 

Seleção de Recursos 

Regras de Recurso Diretório do SQL Server: C:\Program Files\Microsoft SQL ServeriMSSQL12,BIPRD 
Configuração da Instância Diretório do Reporting Services: C:\Program Files\Microsoft SQL ServeriMSRS12.BIPRD 
Configuração do Servidor 


= - E Instâncias instaladas: 
Configuração do Mecanismo d... 





Configuração do Reporting Ser... | Nome da 
| Instância 


ID da Instância Recursos Edição Versão 
Regras de Configuração de Rec... 


Andamento da Instalação 


Concluída 





< Voltar Avançar > Cancelar 
































Mantenha as opções padrão para Configuração do Servidor 
e clique em Avançar . Depois, o instalador apresentará a 
Configuração de Mecanismo de Banco de Dados . Na aba de 
Autenticação , garanta ter adicionado o usuário atual. 


A aba de Diretório de Dados é onde podemos alterar o 
padrão para criação dos arquivos de dados do SQL ( .mdf , .lfd ) 
em discos que não o C:\ . Existe um conjunto de melhores práticas 
que rogam que, a grosso modo, é interessante que os arquivos de 
dados fiquem em uma unidade diferente da unidade de sistema, e 
que os arquivos de log fiquem em uma terceira unidade. Em nosso 
exemplo, vou efetuar a instalação padrão, com todos os arquivos em 

CN. 
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Configuração do Mecanismo de Banco de Dados 


Especifique o modo de segurança da autenticação, os administradores e os diretórios de dados do Mecanismo de Banco 
de Dados. 








Termos de Licença Diretórios de Dados | Instâncias de Usuário | FILESTREAM | 





Regras Globais 

Microsoft Update 
Atualizações de Produto Modo de Autenticação —— 
Instalar Arquivos de Instalação 


Especifique o modo de autenticação e os administradores para o Mecanismo de Banco de Dados. 


(8) Modo de Autenticação do Windows 


Instalar Regras e =- E > 
( Modo Misto (autenticação do SQL Server e do Windows) 


Seleção de Recursos 
Regras de Recurso Especifique a senha da conta do sa [administrador do sistema) do SQL Server, —— 





Configuração da Instância Digitar Senha: 
Configuração do Servidor 

Configuração do Mecanismo d... 
Configuração do Reporting Ser... Especificar administradores do SQL Server 
Regras de Configuração de Rec... 


Confirmar senha: PE 








Os administradores 
Andamento da Instalação do SQL Server têm 
Concluída acesso irrestrito ao 
Mecanismo de 
Banco de Dados. 




















Adicionar Usuário Atual | | Adicionar... | | Remover 
































Avançar > Cancelar 
































Clique em Avançar e deixe marcada a opção instalar e 
configurar do Reporting Services . Clique em avançar 
novamente e o processo de instalação será iniciado! Estando tudo 
certo, com a instalação finalizada, deverá apresentar um checklist de 
todos os pontos com Éxito : 
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Concluída 


Instalação do SQL Server 2014 concluida com êxito com atualizações de produto. 


-= = 
Termos de Licença Informações sobre a operação de Instalação ou as próximas etapas possíveis: 
Regras Globais 


Microsoft Update 
Atualizações de Produto 





Recurso Status 


Ferramentas de Gerenciamento - Completa: 
Q Conectividade das Ferramentas de Cliente 
Instalar Arquivos de Instalação (9 SDK de Ferramentas de Cliente 
Instalar Regras [7] Compatibilidade das Ferramentas de Cliente co... 


[7] Ferramentas de Geranciamento - Básicas 

© Reporting Services - Nativo 

[27] Serviços de Mecanismo de Banco de Dados 
Configuração da Instância 7] Extrações Semânticas e de Texto Completo para... Éxi 
Configuração do Servidor a e E AE j 


Seleção de Recursos 
Regras de Recurso 


Configuração do Mecanismo d... 
Configuração do Reporting Ser... 


Regat da Oana Bei Exibindo a documentação do produto do SQL Server 
Andamento da Instalação 
Conduída Somente os componentes que você usa para exibir e gerenciar a documentação do SQL Server 
foram instalados. Por padrão, o componente Visualizador da Ajuda usa a biblioteca online. 
Depois de instalar o SQL Server, você pode usar o componente Gerenciador da Biblioteca de 
Ajuda para baixar a documentação para o computador local. Para obter mais informações, 
consulte Usar Microsoft Books Online para SQL Server (<http://go microsoft com/fwlink/? 


O arquivo de log de resumo foi salvo no seguinte local: 


Ai 




















E os componentes do SQL passam a ser exibidos na lista de 
aplicativos instalados (nas versões anteriores, busque no Menu 
Iniciar ): 
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Microsoft SQL Server 2014 


Assistente de... 
NOVO 


am Assistente de... 
BE NOVO 


Assistente de... 
Novo 


Baixar o Microsoft 
SQL Server... 


Central de... 
Novo 


A Central de 
Recursos 


Documentação do 
SQL Server 


Gerenciador de... 
Novo 


Gerenciar... 
Novo 


i' Importação e... 
Novo 


Importação e... 
| Novo 


Orientador de... 
Novo 


ma Projetos e 

CH Exemplos da... 
i] Relatório de Erro... 
- NOVO 


SQL Server 2014... 
Novo 


r SQL Server 2014... 


R NOVO 


SQL Server 2014... 
Bm Novo 


f Utilitário de... 
Novo 


Me Visualizador de... 


k SE] Novo 


Sistema do Windows 


Ajuda e Suporte 


Executar 


E 


Mes Explorador de 
La Arquivos 


Administrativas 


Inicie o SQL Server Management Studio: 


4 Detalhes do Pesquisador de Objetos - Microsont SOL Server Management Studio (Admènistrador) 


so 
* (J ReportsercerstiProTempoa 

w Da Sagra 

= CD Objetos de Servider 

* I Repicação 

+ à Gerenciamento 


ID Bancos de Dados do Sirte- 
U esonsemritPro 
15 Repente es PAT ene 


Estado de Insegenfadte da Poltxa 


FesenSer SEPN Tersts 








mm Gerenciador de 
EIGIS 


Meu computador 
= 


Painel de Controle 
- 


es, Prompt de 
Comando 


Windows 
PowerShell 





s 


Nome de Grupo de Daporbéda Tipo de Contenção 


Nennen 
Nenhom 


Não vamos nos delongar no uso do Management Studio, mas 


para avaliar se a instalação ocorreu com sucesso, basta acessar a 


instância que criamos (o BIPRD ) e expandir os bancos de dados. Os 


bancos de dados do Reporting Services devem estar criados. 
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Abra o navegador na máquina onde foi feita a instalação e digite 
http://localhost/Reports BIPRD/Pages/Folder .aspx . Se 
estiver tudo em ordem, a página a seguir deve ser exibida: 


SH DD his localhost Reports BIPED. D - Of E página Inicia) - Gerencades. E 


Páguia Inicial | Configurações de Site | Ajuda 


SQL Server Reporting Services 


Es Página Inicial te 


Da Mova Pasta JJ] Nova Fonte de Dados Dá Configurações de Pasta t Carregar Arquivo Ü Exitação de Detalhes 


Não há itens em Página Inícial. Clique em Ajuda para obter mais informações sobre esta página 





Caso haja algum problema em alguma parte da instalação, 
procure soluções no site da Microsoft e com a comunidade pelo 
Technet 
(http://social.technet.microsoft.com/wiki/contents/articles/23878.in 
stalling-sql-server-2014-step-by-step-tutorial.aspx). 


2.3 CONCLUSÃO 


Neste capítulo, entendemos a arquitetura do Business 
Intelligence e seus componentes. Esse entendimento é fundamental 
para prosseguirmos na criação de cada uma das partes, o que 
faremos nos próximos capítulos. Configuramos todo o ambiente 
necessário e podemos partir para a implementação! 
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CaríTULO 3 


O DESENHO DO DATA 
WAREHOUSE 


3.1 O CENÁRIO 


Para criarmos uma plataforma de Business Intelligence com fins 
didáticos, vamos estabelecer um cenário, ou seja, uma situação na 
qual implantaremos a nossa plataforma de BI. 


Uma solução nacional de Business Intelligence as a Service, a 
gratuita OpenBI (http://openbi.com.br), tem como premissa que só 
são necessários os dados de notas fiscais (NFs) emitidas para se 
conseguir uma gigantesca gama de informações e indicadores. Além 
disso, dado a obrigatoriedade das notas fiscais eletrônicas, 
praticamente todas as empresas são capazes de gerar arquivos 
contendo os dados oriundos de suas emissões. 


Utilizemos essas mesmas premissas e vamos implementar uma 
plataforma de BI, tendo como informações iniciais os dados de 
notas fiscais emitidas. O interessante dessa abordagem é que, com 
certeza, será possível usar esse exemplo para a implantação real do 
BI em seu ambiente que, posteriormente, poderá crescer para ter 
cada vez mais e mais origens, e poder fornecer mais e mais 
informações. 


Entendendo a estrutura de informações 
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Quando mencionamos dados de notas fiscais, estamos nos 
referindo a documentos que comprovam a compra de um serviço 
ou produto e que podem variar de formato de acordo com a região. 
Contudo, todas possuem algumas informações padrão e será com 
essas informações que trabalharemos: 


Cabeçalho: número e série da Nota Fiscal, data de 
emissão e dados da empresa que emitiu (importante no 
caso do BI trabalhar com múltiplas empresas). 

Dados do Cliente: nome/razão social, endereço, dados 
de contato, como telefone, e-mail, CPF/CNPJ. 
Detalhamento: nome e código dos produtos ou 
serviços, quantidades, preço unitário (às vezes) e preço 
total. 

Rodapé: valor total da nota, valor de impostos, valor de 
frete, dados de transportadora, forma de pagamento (às 
vezes), data de vencimento. 


Pode não parecer muita informação para se fazer análises de 
fenômenos, mas acredite: quando você disponibiliza essas 
informações de forma a possibilitar diversos cruzamentos de dados 
e comparativos históricos, passa a contar com uma poderosa 
ferramenta. Na referida OpenBI, por exemplo, esses dados já 
possibilitam análises como: 


Evolução da receita mensal com comparativo ao 
período anterior e a uma meta; 

Análise de venda por produtos, com tendências de 
demanda e sazonalidade; 

Participação percentual dos produtos na receita total do 
período; 

Vendas por clientes com gráficos de evolução histórica; 
Consulta detalhada de NF com filtros de data, cliente, 
NrNF, produto etc.; 
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e Distribuição geográfica das vendas; 

e Dashboard do cliente (para força de vendas) com dados 
de compras mês a mês, representatividade no semestre, 
histórico de relação com os produtos e detalhamento de 
NEs emitidas. 


Então, para atender ao nosso cenário, vamos trabalhar com as 
informações mínimas. Quando você for efetuar a sua implantação, 
avalie sempre a possibilidade de incluir mais dados a partir do que 
estiver disponível na sua origem. Como veremos no desenho do 
nosso Data Warehouse, pode-se adicionar informações às 
dimensões e aos fatos conforme elas estiverem disponíveis. 


Obtendo e preparando os dados de exemplo 


Se você tem acesso a dados reais, pode avançar para o próximo 
tópico! Caso não, podemos obter facilmente com a Codeplex, um 
hub de soluções open source, que mantém uma área na qual é 
possível encontrar o AdventureWorks para download de diversas 
versões de SQL (2008, 200 R2, 2012 etc.). 


Qualquer versão igual ou anterior ao de nosso ambiente (SQL 
2014) seria compatível. Faremos então o download da versão 2012. 
Basta clicar no link 
http://msftdbprodsamples.codeplex.com/releases/view/93587, e 
selecionar a base para SQL 2012: 
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HOME SOURCE CODE [pawg | DOCUMENTATION ISSUES PEOPLE LICENSE 













E subscribe 
ra Airaa OTHER DOWNLOADS 
ER s Barbi A bio 1 2NNEP9 ano 
dventureWorks Databases — 2012, 2008R2 and 
lalate 
2008 
or SQL Server 
Rating: + Based on 33 ratings | Released: À 
Reviewed: 17 review Updated: ^ 4,2 ick 
Downloads: 942353 Dev status: Stable 4) korks 2014 Sample Databases 
Jul 3, 2015, Stable 
RECOMMENDED DOWNLOAD ttti 
- QL Server 2014 In-Memory OLTP Provider - 
Jf iventurew rks2012_Databasezip ASP.NE 
Jul 9, 2014, Stable 








OTHER AVAILABLE DOWNLOADS Release notifications 


ign in to display notification settings. 





O download será de um ZIP com dois arquivos: 
AdventureWorks2012 Data.mdf e 
Adventureworks2012 1og.1df . Esse é o padrão de arquivos do 


SQL, um para dados ( .mdf ) e outro para log de transações 
(.ldf ). 


Copie esses arquivos para o caminho de dados do SQL. No 
nosso exemplo, foi o diretório padrão C:\Program 
Files\Microsoft SQL Server\MSSQL12.BIPRD\MSSQL\DATA\ : 
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Início Compartilhar Exibir 


































© aiii v P] » Meu computador » Disco Local (C:) > Arquivos de Programas » Microsoft SQL Server » MSSQL12.BIPRD » MSSQL + DATA 
Rians Nome = Data de modificaç.. Tipo Tamanho 
EE Área de Trabalho [[G] AdventureWorks2012 Data 28/08/201223:54 SQL Server Databa.,  193536XB] 
Jý Downloads [LE AdventureWorks2012 log 28/08/201223:54 SQL Server Databa... 504 KB 
El Locais recentes IF master 16/05/2016 15:09 SQL Server Databa... 5.504 KB 
[E mastiog 16/05/2 SQL Server Databa... 2.304 KB 
[ME Meu computador [F model 16/05/2016 15:09 SQL Server Databa.. 4.288 KB 
“he Área de Trabalho [El modellog 16/05/2016 1509 SQL Server Databa... 1.280 KB 
“Fi Documentos LB MSDEData 16/05/2016 15:09 SQL Server Databa... 15.936 KB 
Jý Downloads [El MSDBLog SQL Server Databa,. 4672KB 
“E Imagens [7 ReportServerSBIPRD SQL Server Databa... 5312K8 
“Mb Músicas [El ReportServerSBIPRD log SQL Server Databa... 5.400 KB 
“E Vídeos [Ẹ ReportServerSBIPRDTempDB SQL Server Databa... 4288 KB 
É, Disco Local (C;) [E ReportServerSBIPRDTempDB log SQL Server Databas.. 1.600KB 
[F tempdb SQL Server Databa.., 4.288 KB 
Ei Rede [El templog SQL Server Databa... 512 KB 





Uma vez copiados, abra o Management Studio, conecte na 
instância PRDBI , clique com o botão direito sobre Banco de 
Dados e comande Anexar... (Attach Database). Na janela que se 
abrirá, selecione Adicionar... e, em seguida, marque o arquivo 
do AdventureWorks (apenas os arquivos de dados serão exibidos): 









L) Reset SerrersEiPRÓ Toro DE es 
“a Do 2 bmd 









= D MSRS12 EPRD 
= MSSOLI2DPRO 
=a MSSOL 
a Dm bap 
t em 
Ca DATA 
sa FTO 
* Lã heat 
sa JOBS 
* (DM Log 
é I pida 


leme de arquivo [Adventure Wiodca2012 Data mat “| [Frares de Dadon do Ear de Dark w 


-i 
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Clicando em ok, o SQL procederá a inclusão dessa base ao 
gerenciamento da instância e ela aparecerá no seu explorador da 
instância: 





Arquivo Editar Exibir Depurar Ferramentas Janela Ajuda 
E) srs id | Nova Consulta y eA rA tgl 4 a i ae e H E 


Pesquisador de Objetos 


Conectar ~ 3} 3) m T 2] 1d 
E B WIN-2Q73028G8MF\BIPRD (SQL Server 12.0.2 
= [E Bancos de Dados 
E Bancos de Dados do Sistema 


AdventureWorks2012 





H Diagramas de Banco de Dados 
E Tabelas 
= Em Exibições 
A Sinônimos 
+ Programação 
x O Service Broker 
+ [B Armazenamento 
= [DM Segurança 
= |) ReportServerSBIPRD 
m |] ReportServerSBIPRDTempDB 
+ Segurança 
E Objetos de Servidor 
+ Replicação 
= O Gerenciamento 





Agora vamos executar um comando para salvar os dados como 
se fossem oriundos de um sistema de faturamento (ou ERP) que nos 
seria disponibilizado para a importação na nossa plataforma de BI: 


No Management Studio, logo acima do Pesquisador de 
Objetos , existe o botão Nova Consulta . Clique nele e copie o 
comando a seguir: 


Select 

cast(a. [SalesOrderID] as varchar(100)) gd is 
convert(varchar,a. [OrderDate],102) EHE 
cast(b.[AccountNumber] as varchar (100)) Eid ls 
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cast(d.FirstName + ' ' + d.LastName as varchar(100))+'|'+ 
cast(e.EmailAddress as varchar(100)) + E 
cast(c.[Name] as varchar(100)) +" [!+ 

cast (c.[CountryRegionCode] as varchar(100)) +" [+ 
cast(c. [Group] as varchar(100)) +"[!+ 
Isnull(f. [LoginID], 'Sistema') +" [+ 
Isnull(g.FirstName + ' ' + g.LastName, 'Sistema") +" bis 

-- os dados a seguir são inventados para criar a nossa masssa de t 
estes do Chefe do Vendedor: 


case 

when g.FirstName + ' ' + g.LastName = 'Rachel Valdez' 

then '' -- Ela 

é a Chefe! 

when g.FirstName + ' ' + g.LastName in ('Amy Alberts'",'Garrett 

Vargas") then 'Rachel 

Valdez! -- Eles são o Segundo nivel. 

when g.FirstName + ' ' + g.LastName in ('David Campbell', 'Jae 

Pak', 'Jillian Carson") then 'Amy Albe 

rts' -- Esses são funcionarios da Amy. 

when g.FirstName + ' ' + g.LastName in ('José Saraiva', 'Linda 

Mitchell", 'Lynn Tsoflias', 'Michael Blythe') then 'Garrett Va 
rgas' -- Esses são funcionarios do Garrett. 

when g.FirstName + ' ' + g.LastName in ('Pamela Ansman-Wolfe', 
'Ranjit Varkey Chudukatil') then 'Jillian C 
arson' -- Esses são funcionarios da Jillian. 

when g.FirstName + ' ' + g.LastName in ('Shu Ito", 'Stephen Ji 
ang', 'Syed Abbas!) then 'Michael B 
lythe' -- Esses são funcionarios do Michael. 

when g.FirstName + ' ' + g.LastName in ('Tete Mensa-Annan', 'T 
svi Reiter") then 'Stephen 
Jiang' -- Esses são funcionarios do Stephen. 

Else 'Sistema' -- O Sistema (venda on-line, por exemplo) te 
rá ele mesmo como chefe! 

End EHTE 
isnull(i.ProductNumber, '00000') +'|'+ 
isnull(i.Name,'-') +" i 
isnull(i.[Size],'-') +'|'+ 
isnull(i.[ProductLine],'-') +" he 
isnull(i.[color],'-') ta k 
cast(a.[SubTotal] as varchar(100)) +" [!+ 
cast(a.[TaxAmt] as varchar(100)) +" [+ 
cast(a.[Freight] as varchar(100)) aid fia 
cast (h.UnitPrice as varchar(100)) rp 
cast (h.0orderQty as varchar(100)) as Texto 


from [Sales]. [SalesOrderHeader] as a inner join [Sales]. [Customer] 
as b 
on a.CustomerID = b.CustomerID 
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inner join [Sales]. [SalesTerritory] as c 
on a.TerritoryID = c.TerritoryID 

inner join [Person].[Person] as d 

on b.PersonID = d.BusinessEntityID 

inner join [Person]. [EmailAddress]as e 

on d.BusinessEntityID = e.BusinessEntityID 
left join [HumanResources]. [Employee] as f 
on a.SalesPersonID = f.BusinessEntityID 
left join [Person].[Person] as g 

on f.BusinessEntityID = g.BusinessEntityID 
inner join [Sales]. [SalesOrderDetail] as h 
on a.SalesOrderID = h.SalesOrderID 

inner join [Production].[Product] as i 

on h.ProductID = i.ProductID 

where year([OrderDate]) = 2005 


Para a extração dos dados em arquivo, clique em Resultados 
em Arquivo , destacado em vermelho na imagem seguinte, e 
comande Executar (a exclamação em vermelho, logo ao lado 
esquerdo do botão que acabamos de clicar): 
Projeto Depurar Ferramentas Janela Ajuda 
Consulta bibi A as |--A Sig 
-|| } Executar b Depurar = w 35 ERCE RN ; 


SEA SOLQuery1.sq! - W...Administrador (53) x 











=iSelect 
a. [SalesOrderID] as NrNF, 
QL Server 12.0.2000 - WIN-2073028G8MFPy ^ a. [OrderDate] PAA 
b. [AccountNumber ] as ClienteNr, 
istema d.FirstName + " ' + d.LastName as ClienteNome, 
e.EmailAddress as ClienteEmail 
“n de Nadne r [Namel as Regiankendas 


Você será perguntado quanto a um endereço de destino para 
esse arquivo. Clique em c:N na janela e, com o botão direito, crie 
uma nova pasta chamada Arquivos : 
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dyan bie jue Coie Prego Dope Foamete Pennie Agudo 
Idd dm AAD aA le a E) URENA 
a -|f tea Doe E LT) JT OÇO TO RS, 















Fecrecr 





Dê o nome de MassaDados2005 ao arquivo e clique em 


Abrir . O SQL executará a consulta, criando um arquivo de 
resultados com pouco mais de 1 MB de dados (afinal, são 5.151 
linhas geradas nessa nossa massa de testes) que deve estar com o 
seguinte layout: 





Para visualizar o arquivo .rpt , talvez você tenha de selecionar 
o programa padrão. O bloco de notas serve tranquilamente. Eu 
prefiro o Notepad++, um editor de texto gratuito e com diversos 
recursos! Lembrando: para nosso processo, a visualização do 
arquivo não é necessária, mas é sempre bom ter em mãos uma 
ferramenta para entendermos as fontes de dados se algum problema 
aparecer. 


Até agora temos trabalhado para preparar o nosso ambiente 
transacional para enviar dados para a Plataforma de BI que, por 
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enquanto, nem começamos a criar. 


Mas tendo finalizado essa frente e entendido como está 
estruturada a nossa origem de dados, vamos desenhar o DW que irá 
conter as informações das Notas Fiscais e, assim, possibilitar que 
iniciemos a nossa plataforma! 


Um detalhe é que limitamos nossa massa de dados a um único 
ano, dos 04 anos disponíveis nessa massa. Isso porque vamos criar 
todo nosso ambiente usando essa porção dos dados e, depois, 
iremos criar o arquivo ano a ano, simulando cargas diárias a fim de 
validarmos se os processos incrementais estarão funcionando 
corretamente. 


3.2 O DATA WAREHOUSE 


Para implantar o Data Warehouse, existem algumas regras de 
design e algumas boas práticas. Entre as regras, encontram-se os 
postulados de Imnon, que vimos anteriormente, e também o 
chamado esquema. Já vimos que o DW será baseado em um 
desenho dimensional (fatos e dimensões), mas esse desenho pode 
ter dois esquemas: Esquema Estrela ou esquema Floco de Neve. 


No esquema Estrela (Star Schema), as tabelas Dimensão são 
diretamente relacionadas com a tabela Fato . Não existe 
normalização das informações e as consultas são respondidas da 
maneira mais rápida possível: 
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| oaa | bi 


Já no esquema Floco de Neve (Snow Flake Schema), as 
dimensões podem possuir algum nível de normalização, gerando 
relacionamentos entre as tabelas das dimensões: 


Clientes 


Canal 


E 


Vendas 


Detalhes 


Produtos 
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A escolha por um esquema ou por outro estará relacionada ao 
trabalho (e, consequentemente, custo) de implantação. O modelo 
mais performático e que devemos buscar sempre é o Estrela. Mas às 
vezes a informação é conhecidamente estruturada de forma que a 
desnormalização causará um grande trabalho e, efetivamente, trará 
um ganho de performance bastante baixo. Um exemplo é a 
Geografia. A relação de País, Estado e Cidade é sempre bastante 
conhecida e pouquíssimo mutável. 


Outro ponto nessa escolha é o limite de colunas para a chave 
primária. No caso do SQL (https://msdn.microsoft.com/en- 
us/library/ms143432(v=sql.120).aspx), temos um total de 16 colunas 
para usarmos na chave da Fato. Assim, se tivermos muitas 
dimensões ligadas a Fato, usar o esquema Floco de Neve 
“economizará” colunas para a chave primária. 


Exemplificando, no caso de País, Estado e Cidade, se tivermos 
um esquema Estrela, cada uma das tabelas estaria ligada a Fato, 
consumindo três colunas da chave primaria. Se a tabela de País 
estiver ligada à de Estado, essa à de Cidade e somente essa última à 
Fato, teremos apenas uma coluna usada na chave para mantermos a 
mesma informação. 


Quanto às boas práticas, elas podem variar de profissional para 
profissional, de escola para escola e, eventualmente, podem levantar 
discussões calorosas. Não é meu objetivo postular certo e errado, 
então apenas mencionarei o que tenho feito ao longo dos anos e 
que, na minha experiência profissional, tem se mostrado bastante 
adequado. 


Uma boa prática é a de diferenciar as tabelas do seu DW pela 
especialização dela. Ou seja, se é uma tabela de Dimensão , vamos 
nomeá-la como D NomeDaTabela . Se ela for uma Fato , que seja 

F NomeDaTabela. 
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Um outro ponto é fugir da chamada “notação Húngara”, apelido 
dado à notação de Charles Simonyi para as variáveis de sistema 
criadas a partir de abreviações. Nela, você lê o nome do objeto e não 
faz a menor ideia do que ele faz ou para que ele serve! Então dê 
nomes significativos às tabelas e às colunas. Evite dar nomes 
abreviados, formados por siglas e afins. 


É normal encontrar regras mirabolantes de nomenclaturas nas 
empresas. Mas na prática, cria-se um padrão que não serve 
efetivamente para nada, e que mais atrapalham do que ajudam. 
Então, vamos criar nomes simples e significativos. 


A origem do dado, muitas vezes, deve ser informada mesmo que 
somente para uso no processo de desenvolvimento ou de auditoria, 
sem ser exibido para o usuário final. O processo de se rastrear de 
onde veio e quando um dado foi carregado no DW possui o nome 
de “data lineage” (que também é uma metodologia com seus 
gráficos e conceitos sobre acompanhamento de dados através de um 
processo). 


Na prática do BI, consiste em manter uma coluna de data da 
carga e de origem em cada uma das tabelas do DW. Assim, ao visitar 
um registro, sabe-se quando ele entrou e de onde ele veio. 


Evite criar seu DW antes de tê-lo desenhado primeiramente em 
alguma ferramenta. A visão do todo que um desenho lhe 
proporciona com certeza reduz a chance de erros. Eu costumo usar 
o Enterprise Architect, mas outras soluções existem, como a Model 
Right e a DeZign. 


Feitas as considerações, vamos à implantação. 


Dimensões 


Entre as boas práticas que mencionei, está também a de iniciar o 
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desenho do DW (ou da expansão dele) sempre pelas novas 
dimensões. Existe um motivo prático para isso: como as dimensões 
são as tabelas da Chave Primária, elas precisam existir antes de 
criarmos as Fatos que hospedarão as Chaves Estrangeiras. Se essa 
frase soou como grego, basta entender que para um registro existir 
dentro de uma tabela Fato, ele precisa antes (e obrigatoriamente 
antes) ter sido carregado na tabela Dimensão. Assim sendo, 
começar pelo desenho da Dimensão, que não precisa de uma outra 
entidade para existir, é sempre mais simples. 


Tempo (ou Data) 


Como postulado por Inmon, o DW é sempre variável com o 
tempo, ou seja, a dimensão DATA deve invariavelmente existir. Se é 
essa a regra, então nada mais lógico do que começar nosso DW por 
ela. E ela será composta por uma Chave Primária que pode ser a 
própria Data e colunas de especialização, como Dia, Mês e Ano 
separados, Dia da Semana, Ano Fiscal, Trimestre etc. 


Pode-se ter as informações de especialização que forem 
necessárias. Essas informações poderiam muito bem ser calculadas 
em tempo de exibição, mas procura-se armazená-las justamente 
para que o processo de seleção dos dados e respectiva apresentação 
sejam mais rápidos. Além disso, quando formos acoplar uma 
solução de banco de dados multidimensional (os cubos), a 
existência das informações na Dimensão facilitará bastante a criação 
dos objetos. 


Dessa forma, criei a tabela chamada D Data com a seguinte 
estrutura: 
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D Data 
Data (date) 


Dia (char(02)) 
Mes (char(02)) 


Ano (char(04)) 
DiaSemana (varchar(07)) 





Por prática, não costumo inserir o “data lineage” na dimensão 
temporal. Mostrou-se pouco útil. Mas, fique à vontade caso queira 
ser mais puritano do que eu! 


Cliente 


Uma dimensão que encontramos na maioria dos DW é a 
Cliente. Se vamos vender algo, provavelmente vamos vender para 
alguém! E, como na Tempo, a ideia é criar uma chave que vai 
identificar esse cliente nas Fatos e ir acrescentando demais 
informações. 


Essa chave é geralmente um “indicador artificial”, ou seja, um 
código que vamos estabelecer arbitrariamente para cada registro a 
fim de, principalmente, garantir que as buscas por ele sejam as mais 
rápidas possíveis. A essa chave artificial damos um nome: Surrogate 
Key. Todas as dimensões devem ter essa surrogate. 


A exceção é, como vimos, a Tempo, que pode ela mesma ser 
usada como sua própria chave. Entretanto, se encontrar um DW 
com surrogate na dimensão Tempo, não ache que está errado, pelo 
contrário. Essa é uma das boas práticas que variam bastante! 


Então, além da surrogate, teremos para a Dimensão Cliente e as 


3.2 O DATA WAREHOUSE 67 


especializações como o nome ou razão social, CPF ou CNPJ, 
endereço etc. Dessa forma, criei a tabela chamada D Cliente com 
a seguinte estrutura: 


D Cliente 
ld Cliente (int) 


Cod Cliente (varchar(10)) 
Nome (varchar(50)) 


Email (varchar(50)) 
LinData (date) 
LinOrig (varchar(50)) 





Lembrando de que a coluna Id Cliente será preenchida em 
nosso processo de carga, dado que é uma chave artificial. Uma boa 
prática nesse sentido é padronizar as surrogate como Id e as 
colunas chave oriundas dos sistemas Transacionais sempre 
chamadas de cod . Dessa forma, fica simples identificar a origem da 
informação. Também inseri duas colunas para nosso data 
lineage ,a LinData ea LinOrig . Ambas serão preenchidas 
também no processo do ETL. 


Produto 


Se vendemos para alguém, vendemos algo. A dimensão de 
Produto vai possuir a surrogate e as especializações do produto, 
como SKU, Nome, Grupo, Subgrupo, e demais propriedades como 
cor, peso, tamanho etc. 


Essa dimensão varia muito de caso para caso, e as informações 
contidas nela dependem totalmente de como a sua empresa gerencia 
seus produtos. Mas uma questão interessante é que essa dimensão, 
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na maioria das vezes, possui a propriedade de ter pequenas 
alterações em seus registros de tempos em tempos. Essas dimensões 
que sofrem variações ao longo do tempo são chamadas de Slowly 
Changing Dimension. 


Por exemplo, imagine que em 2015 uma empresa vendia o 
produto “Curso de BI”. Em 2016, a empresa muda o nome do 
produto para “Curso de BI a Custo Zero”. Basicamente, as três 
formas mais comuns de se lidar com essas alterações são: 


e ISCD: simplesmente atualiza-se a dimensão para 
contemplar a nova informação. Por ferir o “não volátil” 
que Inmon prega, essa opção faz com que percamos o 
passado. Se atualizarmos a dimensão Produto, o que vai 
ocorrer é que, quando exibirmos um relatório de 
vendas de 2015 e de 2016, veremos apenas o produto 
com o novo nome “Curso de BI a Custo Zero” sendo 
vendido nos dois anos. 

e 2SCD: cria-se uma nova entrada na tabela de 
Dimensão, deixando uma notação de “inativo” no 
registro original e de “ativo” no novo registro. Nesse 
caso, quando exibirmos um relatório de vendas de 2015 
e 2016, veremos duas linhas, uma do produto “Curso de 
BI” com dados para 2015 e sem dados para 2016, e 
outra linha do produto “Curso de BI a Custo Zero” sem 
dados para 2015 e com dados para 2016. 

e 3SCD: para as dimensões que sofrerão alterações, 
coloca-se uma coluna de valor histórico, e atualiza-se o 
valor da coluna de valor corrente e de valor histórico 
quando há uma alteração. Nesse caso, quando 
exibirmos um relatório de vendas de 2015 e 2016, 
veremos uma única linha com vendas para 2015 e 2016 
com o nome novo de “Curso de BI a Custo Zero”, mas 
com a possibilidade de consultar o nome anterior. 
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Baseado na minha experiência e sem entrar no mérito de certo e 
errado, a 2SCD se mostra a melhor por alguns motivos: 


e Ela mantém uma representação fiel do passado (a ISCD 
não); 

e Ela suporta infinitas alterações (a 35CD só suporta o 
histórico de uma alteração); 

e Ela mantém as ligações pelas surrogates, mantendo as 
buscas o mais rápido possível. 


Assim sendo, no caso da Dimensão Produto, a trataremos como 
Slowly Changing Dimension resolvida pela segunda forma 2SCD. 
Claro que, em uma implantação em sua empresa, deve-se discutir 
com as áreas clientes para determinar como o usuário deseja 
visualizar os dados. Em alguns casos, pode-se, por exemplo, criar a 
dimensão “Produto Imediato” (resolvida como ISCD) e a “Produto 
Histórico” (resolvida como 2SCD), mantendo duas visões distintas 
da mesma informação. 


Dessa forma, criei a tabela chamada D Produto com a seguinte 
estrutura: 


D Produto 
Id Produto (int) 


Cod Produto (varchar(20)) 
Nome (varchar(50)) 
Tamanho (varchar(05) 


Linha (varchar(05)) 
Cor (varchar(20)) 
Ativo (char(01)) 
LinData (date) 
LinOrig (varchar(50)) 
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Note que temos a surrogate, as qualificações oriundas do 
sistema origem e um flag para determinar se o registro está ou não 
ativo (para atender à 2SCD). Há quem questionará onde estão as 
datas de início e fim de vigência do registro. Na verdade, eu, 
também por experiência do dia a dia mais do que por seguir um 
conceito acadêmico, resolvo essas datas na ligação com a Fato. 


Enquanto o registro estiver ativo, haverá lançamentos na Fato 
para ele. Quando ele não estiver mais ativo, as datas dos novos 
registros estarão vinculadas ao produto ativo. E se não houver 
venda? Não havendo um Fato, a informação na Dimensão é muito 
pouco útil! Dessa forma, simplificamos a estrutura e o processo de 
carga sem comprometer a informação exibida. Os dados de lineage 
constam como as duas últimas colunas. 


Geografia 


Geralmente, uma das informações relativas aos Clientes é de 
onde eles são, e isso é bastante importante. Saber onde nossos 
produtos fazem sucesso e onde eles precisam ser mais incentivados 
pode ser de grande valia. Dessa forma, a Dimensão de Geografia 
pode ser formada por País, Estado, Cidade e o que mais de 
informação estiver disponível, como Bairro, Logradouro, CEP, 
Região (Norte, Sudeste, Sul etc.). 


Não é incomum as empresas terem divisão territorial do 
processo de vendas. Se for o caso, pode-se colocar na Dimensão 
Geografia a Região de Venda, que podem ser definidas por range de 
CEP, por coordenadas cardinais etc. 


Dessa forma, criei as tabelas chamadas D GrupoGeografico , 
D Pais e D RegiaoVendas com as seguintes estruturas: 
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D GrupoGeografico 


Id GrupoGeo (int) 


Nome (varchar(50)) 
LinData (date) D Pais 
LinOrig (varchar(50)) 








ld Pais (int) 


ld GrupoGeo (int) 
Sigla (char(02)) 
LinData (date) 


LinOrig (varchar(50)) 





D RegiaoVendas 
Id RegiaoVendas (int) 


ld Pais (int) 
Nome(varchar(20)) 


LinData (date) 
LinOrig (varchar(50)) 





A estrutura segue a primeira Forma Normal no esquema Floco 
de Neve, no qual colocamos a Primary Key da tabela pai como 
Foreign Key na tabela filho, evitando assim os chamados grupos de 
repetição. Dessa forma, ligaremos apenas a tabela mais granular (ou 
seja, a D Regiaovendas coma Fato ), e poderemos ter todos os 
dados das tabelas pai. 


E, claro, temos as colunas de data lineage em todas as três 
tabelas. 


Vendedor 


Nem sempre esse dado está disponível em arquivos de notas 
fiscais, mas vou inserir em nosso exemplo para essa dimensão cobrir 
um exemplo bastante importante: a Parent-Child Dimension, ou 
dimensão de Pais e Filhos. Esta permite criar uma hierarquia 
dinamicamente, com infinitos níveis e diferentes estruturas. E a 
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flexibilidade toda está simplesmente na forma como ela é 
construída! 


Vamos imaginar que nossa empresa tenha uma estrutura de 
Vendedor definida por um Diretor que possui alguns Gerentes. 
Estes podem ou não ter Coordenadores, dependendo do tamanho 
do time. Se não houver Coordenador, os Vendedores estarão logo 
abaixo do Gerente. Se houver Coordenador, ele estará abaixo do 
Gerente e os Vendedores abaixo do Coordenador. Implementar essa 
estrutura de forma flexível basicamente se resolve com uma coluna 
na tabela de Dimensão! 


Na dimensão Vendedor , teremos a coluna chave, a surrogate, e 
as colunas de especializações: Nome, CPF, matrícula, e-mail etc. 
Além delas, vamos incluir uma coluna para Chefe . Nela, vamos 
inserir o valor que está na surrogate da pessoa que será o chefe desse 
Vendedor. Pronto! Assim, dinamicamente, podemos ter sempre 
como montar a árvore de hierarquia. 


Vale lembrar de que esse conceito serve para qualquer situação 
em que se tenha a relação de um registro “pai” e que se pode ter n 
registros “filhos”. Desse jeito, monta-se a estrutura dinamicamente 
de relações entre esses registros, como uma árvore de diretórios no 
seu Windows Explorer, por exemplo! 


Dessa forma, criei a tabela chamada D Funcionario com as 
seguintes estruturas: 
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~~ D Funcionario 


Id_Funcionario (int) 


Nome (varchar(50)) 
Login (varchar(50)) 


Id Chefe (int) 
LinData (date) 
LinOrig (varchar(50)) 





Vale mencionar que não batizamos essa dimensão de 
“Vendedor”, porque, via de regra, essas pessoas são funcionárias da 
empresa. Quando nosso DW for crescendo, eventualmente dados de 
Recursos Humanos serão importados e todos os funcionários 
estarão carregados. No caso de termos uma dimensão “Vendedor”, 
teríamos esses registros duplicados com a dimensão “Funcionário”, 
ou teríamos de alterar o nome da Dimensão, o que geraria um belo 
impacto em retrabalho com o que já estivesse em produção! 


A coluna Id Chefe será o que garantirá da relação de Parent- 
Child. Note que, para tanto, a tabela é autorreferenciada, ou seja, a 
Primary Key está ligada a uma Foreign Key e ambas estão na mesma 
tabela. 


No nosso cenário, cobrimos a dimensão Tempo, uma Dimensão 
Simples (a Cliente), uma SCD (a Produto), uma implantação em 
esquema Snow Flake (a Geografia) e uma Parent-Child (a 
Vendedor). Com isso, cobrimos os principais tipos de dimensões, e 
vamos parar por aqui para não nos delongarmos muito! 


Existem dimensões calculadas, dimensões que se comportam 
como 2SCD e Parent-Child ao mesmo tempo etc. Mas com os casos 
que cobrimos já temos base para resolver a esmagadora maioria do 
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que se encontra em uma implantação inicial de BI. 


Em sua implantação, aproveite para carregar e disponibilizar 
todas as informações disponíveis mesmo que elas não tenham sido 
solicitadas. Se sua origem de dados tiver, por exemplo, a informação 
de Loja ou Canal de Venda, crie as respectivas Dimensões! Sempre 
que a informação existir, avalie seriamente a possibilidade de incluí- 
la no seu DW. 


Fatos 


Uma vez que tenhamos desenhado todas as dimensões 
conhecidas (e com certeza novas dimensões aparecerão com a vida 
do DW), é hora de desenhar a tabela Fato. No nosso caso, temos 
dois níveis distintos de granularidade: o cabeçalho e o detalhe. 


Recordando da nossa matriz de Fatos e Dimensões, a MFD, 
veremos que temos cruzamentos que percorrem todas as 
possibilidades e cruzamentos específicos. Note que, no cruzamento 
das “Measures” com a Data, poderemos ver todas as medidas por 
todas as informações temporais: 

Dimensão Data 


ale MERMSETS Data Composta Ano Mês Dia 
Type Time Years MonthOfYear | DayOfMonth 





Vlrimpostos 


Vifrete 





Sales Header 








PrecoUnitario 
Quantidade 





Sales Details 

















Isso significa que, por termos a Data da Venda, saberemos os 
valores de Impostos, por exemplo, num determinado mês. 
Saberemos também quanto vendemos de um determinado produto 
em um ano específico, e assim por diante. 


As dimensões de cliente, funcionários e de região de vendas 
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seguem o mesmo padrão. O detalhe para essa última é que, na MFD, 
colocamos o nome da dimensão sempre com o termo mais granular, 
ou seja, Região Venda! E para cada nível, o nome significativo 
(aquele que o usuário poderá ver e será compreensível para ele): 


Dimensão Regiao Vendas 


Biele MENMENIS Regiao Vendas Grupo Pais RegiaoVendas 
Type SnowFlake DB STR DB STR DB STR 














PrecoUnitario 
Quantidade 


Sales Header serao 
VirFrete 





Sales Details 








Mas ao verificarmos o cruzamento da dimensão Produto com as 
nossas “Measures”, entendemos que nem sempre os cruzamentos 
valerão para todos: 


Dimensão Produto 


Hierarquia Default | Produto | Nome | 





Sales Header 





PrecoUnitario 
Quantidade 





Sales Details 








Note que não teremos os dados referentes ao cabeçalho da Nota 
para a dimensão Produto, o que faz todo sentido, dado que o 
produto é mais granular do que os dados do cabeçalho! 


Explicando: se uma Nota tem diversos produtos e apenas um 
valor de frete, qual seria o valor de frete por produto? Não é possível 
saber! O valor do Frete não está disponível para a dimensão 
Produto! 


Vale mencionar que existiria, sim, uma forma de calcular esse 
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frete por produto. Poderíamos fazer o que se chama de “rateio”, ou 
seja, cada produto recebe o valor da média ponderada do valor do 
frete. Se seu usuário assim quiser, muito bem! Calcule para ele, e 
torne os totais “mais granulares” a ponto de serem exibidos para os 
detalhes. Mas por ora é interessante entender que nem sempre todas 
as “Measures” estarão obrigatoriamente disponíveis para todas as 
Dimensões. 


Fato Vendas 


A nossa Fato será sobre Vendas! Teremos os dados de quantas 
vendas fizemos, qual o valor, impostos e taxas totais de cada uma, o 
que foi vendido e quanto de cada produto! 


Um ponto interessante é entender o modelo de dados que 
usaremos para a Fato de Vendas. Na verdade, para esse caso, 
teremos mais de uma tabela física respondendo por essa “Fato 
Lógica”. 


Isso quer dizer que: quando houver um evento (um Fato que no 
nosso caso é a venda) em que há diferentes granularidades (nesse 
caso, um cabeçalho e um detalhamento), poderemos ter mais de 
uma tabela física para responder a essa situação. Dessa forma, criei 
as tabelas chamadas F Venda e F VendaDetalhe com as 
seguintes estruturas: 
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F Venda 


Data (date) 

Nr NF (varchar(10)) 
Id Cliente (int) 

Id Funcionario (int) 


Id RegiaoVendas (int) E Vendabénilne 


Data (date) 

Nr. NF (varchar(10)) 
Id Cliente (int) 

Id Funcionario (int) 
Id RegiaoVendas (int) 
Id Produto (int) 


Vlr Imposto (decimal(18,2)) 
Vlr Frete (decimal(18,2)) 
LinData (date) 

LinOrig (varchar(50)) 








Vir Unitario (decimal(18,2)) 
Qtd Vendida (int) 

LinData (date) 

LinOrig (varchar(50)) 





Note que as tabelas de Fato possuem uma Primary Key 
composta com todas as demais chaves das Dimensões que se 
relacionam com ela. Ela mesma não possui nenhuma surrogate 
própria. 


Outro ponto é que a Fato também possui as informações de data 
lineage e o número da nota fiscal ( Nr. NF ). Existe uma prática de 
colocar dados descritivos nas Fatos quando eles estão na mesma 
granularidade dela. Contudo, precisamos usar esse recurso com 
parcimônia! 


No nosso modelo, colocamos um dado descritivo “pequeno” 
(com poucos caracteres). Se tivéssemos textos descritivos, como o 
campo de Observação da NF, por exemplo, ou diversos campos 
descritivos, o recomendado seria criar uma dimensão para a nota 
fiscal e atribuir a ela a responsabilidade de conter os textos todos. 
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Em ambientes de DW gigantescos, a inclusão de campos 
grandes nas Fatos faz com que haja maior fragmentação e 
consequente perda de performance. Se nos lembrarmos de que o 
DW é essencialmente desenhado para manter a performance das 
consultas, evitar práticas que afetem essa performance é, no 
mínimo, coerente. 


Outro ponto a notar é que o sumarizador na nota fiscal não 
consta na F Venda . Teremos esse dado calculado pela somatória 
da F VendaDetalhe . Com esse conjunto de entidades desenhadas, 
temos o nosso DW conceituado! É hora de implantá-lo no SQL e 
torná-lo algo real. 


Para iniciarmos, vamos criar a Base de Dados que será nosso 
DW. Eu geralmente uso o nome da empresa e a notação DW ao 
final. Para nosso exemplo, vamos usar apenas DW. 


No Management Studio, clique com o botão direito do mouse 
sobre Banco de Dados e selecione Novo Banco de Dados : 
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Conectar di 3 e F 2].á 





= B WIN-2Q73028G8MF\BIPRD (SQL Server 12.0.2000 - WIN-2Q73028G8MF\Adr] 
= EM Bancos de Dados 

E Bancos de Dados do i 

= Adventurewd j 






m O ReportServer om ea J Soit [ES Auda 

= DM Segurança E Opções 

= Em Objetos de Servid 4% Grupos de Arquivos Nome do banco de dados: 
z Cm Replicação 

E Gerenciamento 




















Proprietário: 





Arquivos de banco de dados: 

Nome Lógico Tipo de Arquivo Grupo de Arquivos Tamanho Inicial (MB) Aumento Autom; 
DW Dados de LIN. PRIMARY Em 1 MB, limita 
DW log LOG Não Aplicável Pê Em 10 por centi 


Conexão 


Servidor: 
WIN-2073028G8MPNBIPRD 


Conexão: 
WIN-2073028G8MF administrado 


5} Exbir propriedades da 
conexão 


Pronto 























Vamos manter todas as opções padrão para simplificar! Clique 
em OK ea base de dados chamada Dw aparecerá na árvore de 
objetos. Uma vez com sua Base de Dados criada, vamos à criação 
das Dimensões e das Fatos. Para tanto, basta executar o seguinte 
comando: 


USE [DW] 
Go 


CREATE TABLE [dbo].[D Cliente]( 
[Id Cliente] [int] identity(1,1) NOT NULL, 
[Cod Cliente] [varchar](10) NOT NULL, 
[Nome] [varchar](50) NOT NULL, 
[Email] [varchar](50) NOT NULL, 
[LinData] [date] NOT NULL, 
[LinOrig] [varchar](50) NOT NULL, 

CONSTRAINT [PK D Cliente] PRIMARY KEY CLUSTERED 


( 
[Id Cliente] ASC 
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)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, IGNORE DUP K 
EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS = ON) ON [PRIMARY 
] 

) ON [PRIMARY] 

Go 


CREATE TABLE [dbo].[D Datal( 
[Data] [date] NOT NULL, 
[Dia] [char](2) NOT NULL, 
[Mes] [char](2) NOT NULL, 
[Ano] [char](4) NOT NULL, 
CONSTRAINT [PK D Data] PRIMARY KEY CLUSTERED 
( 
[Data] ASC 
)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, IGNORE DUP K 
EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS = ON) ON [PRIMARY 
] 
) ON [PRIMARY] 
GO 


CREATE TABLE [dbo].[D Funcionario]( 
[Id Funcionario] [int] identity(1,1) NOT NULL, 
[Nome] [varchar](50) NOT NULL, 
[Login] [varchar](50) NOT NULL, 
[Id Chefe] [int] NULL, 
[LinData] [date] NOT NULL, 
[Linorig] [varchar](50) NOT NULL, 
CONSTRAINT [PK D Funcionario] PRIMARY KEY CLUSTERED 
( 
[Id Funcionario] ASC 
)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, IGNORE DUP K 
EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS = ON) ON [PRIMARY 
] 
) ON [PRIMARY] 
GO 


CREATE TABLE [dbo].[D GrupoGeografico]( 
[Id GrupoGeo] [int] identity(1,1)NOT NULL, 
[Nome] [varchar](50) NOT NULL, 
[LinData] [date] NOT NULL, 
[LinoOrig] [varchar](50) NOT NULL, 

CONSTRAINT [PK D GrupoGeografico] PRIMARY KEY CLUSTERED 

( 
[Id GrupoGeo] ASC 

)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, IGNORE DUP K 
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EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS = ON) ON [PRIMARY 
] 

) ON [PRIMARY] 

Go 


CREATE TABLE [dbo].[D Pais]( 
[Id Pais] [int] identity(1,1) NOT NULL, 
[Id GrupoGeo] [int] NOT NULL, 
[Sigla] [char](2) NOT NULL, 
[LinData] [date] NOT NULL, 
[LinOrig] [varchar](50) NOT NULL, 
CONSTRAINT [PK D Pais] PRIMARY KEY CLUSTERED 
( 
[Id Pais] ASC 
)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, IGNORE DUP K 
EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS = ON) ON [PRIMARY 
] 
) ON [PRIMARY] 
GO 


CREATE TABLE [dbo].[D Produto]( 
[Id Produto] [int] identity(1,1) NOT NULL, 
[Cod Produto] [varchar](20) NOT NULL, 
[Nome] [varchar](50) NOT NULL, 
[Tamanho] [varchar](5) NOT NULL, 
[Cor] [varchar](20) NOT NULL, 
[Ativo] [char](1) NOT NULL, 
[LinData] [date] NOT NULL, 
[LinoOrig] [varchar](50) NOT NULL, 
CONSTRAINT [PK D Produto] PRIMARY KEY CLUSTERED 
( 
[Id Produto] ASC 
)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, IGNORE DUP K 
EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS = ON) ON [PRIMARY 
] 
) ON [PRIMARY] 
GO 


CREATE TABLE [dbo].[D RegiaoVendas]( 
[Id RegiaoVendas] [int] identity(1,1) NOT NULL, 
[Id Pais] [int] NOT NULL, 
[Nome] [varchar](20) NOT NULL, 
[LinData] [date] NOT NULL, 
[LinOrig] [varchar](50) NOT NULL, 
CONSTRAINT [PK D RegiaoVendas] PRIMARY KEY CLUSTERED 


82 3.20 DATA WAREHOUSE 


)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, 
EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS 


] 


[Id RegiaoVendas] ASC 


) ON [PRIMARY] 


GO 


CREATE TABLE [dbo]. [F_Venda]( 


( 


)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, 
EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS 


] 


[Data] [date] NOT NULL, 

[Nr NF] [varchar] (10) NOT NULL, 

[Id Cliente] [int] NOT NULL, 

[Id Funcionario] [int] NOT NULL, 

[Id RegiaoVendas] [int] NOT NULL, 

[Vlr Imposto] [decimal](18, 2) NOT NULL, 
[Vir Frete] [decimal](18, 2) NOT NULL, 
[LinData] [date] NOT NULL, 

[LinOrig] [varchar](50) NOT NULL, 


CONSTRAINT [PK F Venda] PRIMARY KEY CLUSTERED 


[Data] ASC, 

[Nr NF] ASC, 

[Id Cliente] ASC, 

[Id Funcionario] ASC, 
[Id RegiaoVendas] ASC 


) ON [PRIMARY] 


GO 


CREATE TABLE [dbo].[F_VendaDetalhe]( 


( 


[Data] [date] NOT NULL, 

[Nr NF][varchar] (10) NOT NULL, 
[Id_Cliente] [int] NOT NULL, 
[Id_Funcionario] [int] NOT NULL, 
[Id_RegiaoVendas] [int] NOT NULL, 
[Id_Produto] [int] NOT NULL, 
[Vlr_Unitario] [decimal](18, 2) NOT NULL, 
[Qtd_Vendida] [int] NOT NULL, 

[LinData] [date] NOT NULL, 

[Lin0rig] [varchar] (50) NOT NULL, 


CONSTRAINT [PK_F_VendaDetalhe] PRIMARY KEY CLUSTERED 


[Data] ASC, 
[Nr_NF] ASC, 
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IGNORE_DUP_K 
ON) ON [PRIMARY 


IGNORE_DUP_K 
ON) ON [PRIMARY 
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[Id Cliente] ASC, 

[Id Funcionario] ASC, 

[Id RegiaoVendas] ASC, 

[Id Produto] ASC 
)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, IGNORE DUP K 
EY = OFF, ALLOW ROW LOCKS = ON, ALLOW PAGE LOCKS = ON) ON [PRIMARY 
] 
) ON [PRIMARY] 
GO 


CREATE NONCLUSTERED INDEX [IX D Pais] ON [dbo].[D Pais] 
( 

[Id GrupoGeo] ASC 
)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, SORT IN TEMP 
DB = OFF, DROP EXISTING = OFF, ONLINE = OFF, ALLOW ROW LOCKS = ON, 
ALLOW PAGE LOCKS = ON) ON [PRIMARY] 
GO 


CREATE NONCLUSTERED INDEX [IX D RegiaoVendas] ON [dbo].[D Regiaove 
ndas] 
( 

[Id Pais] ASC 
)WITH (PAD INDEX = OFF, STATISTICS NORECOMPUTE = OFF, SORT IN TEMP 
DB = OFF, DROP EXISTING = OFF, ONLINE = OFF, ALLOW ROW LOCKS = ON, 
ALLOW PAGE LOCKS = ON) ON [PRIMARY] 
GO 


ALTER TABLE [dbo].[D Pais] WITH CHECK ADD CONSTRAINT [FK D Pais. 
D GrupoGeografico] FOREIGN KEY([Id GrupoGeo]) 

REFERENCES [dbo].[D GrupoGeografico] ([Id GrupoGeo]) 

GO 


ALTER TABLE [dbo].[D Pais] CHECK CONSTRAINT [FK D Pais D GrupoGeog 
rafico] 
GO 


ALTER TABLE [dbo].[D RegiaoVendas] WITH CHECK ADD CONSTRAINT [FK 
-D RegiaoVendas D Pais] FOREIGN KEY([Id Pais]) 

REFERENCES [dbo].[D Pais] ([Id Pais]) 

GO 
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ALTER TABLE [dbo].[D RegiaoVendas] CHECK CONSTRAINT [FK D RegiaoVe 
ndas D Pais] 
GO 


ALTER TABLE [dbo].[F Venda] WITH CHECK ADD CONSTRAINT [FK F Vend 
a D Cliente] FOREIGN KEY([Id Cliente]) 

REFERENCES [dbo].[D Cliente] ([Id Cliente]) 

GO 


ALTER TABLE [dbo].[F Venda] CHECK CONSTRAINT [FK F Venda D Cliente 


] 
Go 


ALTER TABLE [dbo].[F Venda] WITH CHECK ADD CONSTRAINT [FK F Vend 
a D Data] FOREIGN KEY([Data]) 

REFERENCES [dbo].[D Data] ([Data]) 

Go 

ALTER TABLE [dbo].[F Venda] CHECK CONSTRAINT [FK F Venda D Data] 
Go 


ALTER TABLE [dbo].[F Venda] WITH CHECK ADD CONSTRAINT [FK F Vend 
a D Funcionario] FOREIGN KEY([Id Funcionario]) 

REFERENCES [dbo].[D Funcionario] ([Id Funcionario]) 

GO 


ALTER TABLE [dbo].[F Venda] CHECK CONSTRAINT [FK F Venda D Funcion 
ario] 
GO 


ALTER TABLE [dbo].[F Venda] WITH CHECK ADD CONSTRAINT [FK F Vend 
a D RegiaoVendas] FOREIGN KEY([Id RegiaoVendas]) 

REFERENCES [dbo].[D RegiaoVendas] ([Id RegiaoVendas]) 

GO 


ALTER TABLE [dbo].[F Venda] CHECK CONSTRAINT [FK F Venda D RegiaoV 
endas] 
GO 


ALTER TABLE [dbo].[F VendaDetalhe] WITH CHECK ADD CONSTRAINT [FK 
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-F VendaDetalhe D Produto] FOREIGN KEY([Id Produto]) 
REFERENCES [dbo].[D Produto] ([Id Produto]) 
GO 


ALTER TABLE [dbo].[F VendaDetalhe] CHECK CONSTRAINT [FK F VendaDet 
alhe D Produto] 
GO 


ALTER TABLE [dbo].[F VendaDetalhe] WITH CHECK ADD CONSTRAINT [FK 

-F VendaDetalhe F Venda] FOREIGN KEY([Data], [Nr NF], [Id Cliente], 
[Id Funcionario], [Id RegiaoVendas]) 

REFERENCES [dbo].[F Venda] ([Data], [Nr NF], [Id Cliente], [Id Func 

ionario], [Id RegiaoVendas]) 

Go 


ALTER TABLE [dbo].[F VendaDetalhe] CHECK CONSTRAINT [FK F. VendaDet 
alhe F Venda] 
Go 

Executado o comando, ao expandir as tabelas do seu DW, todas 


as tabelas estarão criadas em um esquema conforme: 


rem 
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3.3 CONCLUSÃO 


Neste capítulo, criamos o coração da nossa plataforma de BI! 
Nosso Data Warehouse ganhou corpo e está preparado para receber 
os dados, o que faremos no próximo capítulo! 


Alguns conceitos de bancos de dados básicos ajudam na criação 
do seu DW: 


e Nenhuma coluna pode aceitar null . Se um dado veio 
nulo, o processo de carga deve entender se é algo 
esperado ou um erro. Deve-se preencher o campo com 
uma informação genérica para que se saiba que aquele 
dado não foi carregado. Essa prática resolve muitos 
problemas de origens de dados incoerentes. Faremos 
alguns exemplos no nosso ETL! 


e Toda coluna que for chave estrangeira deve ser 
indexada (conforme consta no comando que 
executamos anteriormente)! Se houver a necessidade de 
indexar outras colunas por conta das buscas, sem 
problemas. Mas as chaves estrangeiras serão usadas 
com certeza, então devemos indexá-las! 


e Hoje em dia, não há uma gigantesca preocupação com 
espaço em disco, mas nossa versão de SQL é gratuita e 
tem suas limitações. Então vamos tentar trabalhar com 
os menores data types possíveis. 


Com tudo criado no lado do Data Warehouse, é hora de 
carregarmos os dados! 
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CAPÍTULO 4 


O PROCESSO DE ETL 


4.1 CONSIDERAÇÕES INICIAIS 


Já temos o nosso Data Warehouse montado e conhecemos a 
origem das informações (seja porque seguimos o passo a passo deste 
livro, ou porque pegamos dados reais do ambiente da nossa 
empresa). Nesse ponto, temos todas as informações necessárias para 
criarmos o processo que vai ler das origens, transformar e carregar 
os dados no nosso DW. 


Se tivéssemos uma ferramenta de ETL, como o SSIS, por 
exemplo, nosso processo seria um pouco mais simples e talvez mais 
performático! Como nossa proposição é fazer todo o processo sem 
nenhuma ferramenta paga, vamos usar o que temos em mãos: 
Transact-SQL e Agendamentos do Windows! 


Mas uma carga feita inteiramente em código tem uma enorme 
vantagem: vamos poder conceituar cada um dos passos, e assim 
teremos subsídios para implantar esses mesmos passos em outras 
ferramentas quando nosso budget nos permitir adquiri-las. 


Como vamos fazer todos os processos com o T-SQL (ou 
Transact SQL, a linguagem de programação do SQL Server, tal qual 
o PL/SQL é a do Oracle), alguns conceitos dessa linguagem serão 
necessários. Passaremos pelos tópicos mais específicos dos 
processos que utilizaremos, mas se você ainda não tem 
familiaridade nenhuma com ela, recomendo dar uma pausa para 
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estudar um pouco antes de prosseguir. 


Nosso maior uso será da instrução SELECT do T-SQL. Se quiser 
um tutorial inicial sobre o tema, o MSDN tem um conjunto de 
lições que usa justamente a base de dados AdventureWorks que nós 
temos em nosso servidor. 


Então, clique em https://msdn.microsoft.com/en- 
us/library/cc546519.aspx, execute os comandos, e entenda os 
conceitos! Recomendo as duas primeiras lições (em inglês). 


Havendo o interesse em se aprofundar (e eu sempre recomendo 
que esse aprofundamento ocorra!), recomendo o livro Microsoft 
SQL Server 2012 T-SQL Fundamentals (Developer Reference) e o 
Microsoft SQL Server 2012 T-SQL Fundamentals (Developer 
Reference), ambos da editora Microsoft Press. 


O SQL Server é um produto imenso, com centenas de assuntos 
para se aprofundar, desde instalação e administração, até as 
ferramentas de Business Intelligence, como o SSAS, SSRS e SSIS, 
passando por replicação, alta disponibilidade etc. Porém, tudo 
começa com um bom entendimento de como usar a sintaxe de 
comando dele. Por isso, seja qual seu caminho de interesse com esse 
produto, conhecer bem T-SQL lhe será sempre muito útil. 


4.2 DATA STAGE 


Um dos postulados do Data Warehouse é que ele não é volátil, 
ou seja, se um registro entrou nele, não pode ser alterado. Mas no 
processo de carga, teremos de avaliar se o dado está correto ou não, 
precisaremos eventualmente alterar a formatação dele, verificar se 
ele deve mesmo ser carregado ou se ele é uma duplicidade etc. 


Se vamos proceder com todos esses trabalhos e se o DW não 
deve sofrer alterações, teremos de arrumar um outro lugar para 


4.2 DATA STAGE 89 


fazer tudo isso. Esse lugar é, na verdade, uma base de dados que se 
usa para trabalhar com os dados e que é populada no processo de 
carga e depois devidamente limpa para o próximo ciclo. 


Essa base recebe o nome de Data Stage e, além de conter as 
tabelas temporárias, vai conter também todos os códigos que 
faremos para o processo de ETL, as Stored Procedures 
(procedimentos armazenados). Para criarmos nossa Data Stage, 
vamos abrir o Management Studio. Clique em Banco de Dados 
com o botão direito e selecione Novo Banco de Dados... : 


Arquivo Editar Exibir Projeto Depurar Ferramentas Janela Ajuda 
= Jr id ud A | Nova Consulta Dy tb) do Ss) qi 84] + 
Pesquisador de Objetos 
Conectar” 34 3j a 7 G 
= [Ø WIN-2Q73028G8MA BIP] Selecionar uma página ES Soipt ~ IP} Ajuda 
= [E Bancos de Dados LF Geral k 
J 2 Opções 
1 Grupos de Arquivos Nome do banco de dados: 


























Proprietário: 





= [EM Segurança 

= [EM Objetos de Servidor 
& Em Replicação 

= O Gerenciamento 


Arquivos de banco de dados: 

Nome Lógico Tipo de Arquivo Grupo de Arquivos cial (MB) Aumento Autom} 
DS Dados de LIN... PRIMARY r COT Em 1MB. limta 
DS log LOG Não Aplicável Em 10 por centi 


Conexão 
Servidor: 
WIN-2Q73028G8MF\BIPRD 


Conexão: 
WIN-2Q73028G8MF\Administradc 


4 Exibir propriedades da 
conexão 


Progresso 

















Dê o nome de DS e clique em OK. Novamente vamos usar 
todas as opções padrão para facilitar a criação. 


Uma vez que temos a base DS, precisaremos habilitar uma 
função do SQL que, por padrão, vem desabilitada. No Management 
Studio, rode o comando a seguir: 
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exec sp configure "show advanced options", 1 

go 

reconfigure 

go 

EXEC sp configure 'xp cmdshell', 1 

go 

reconfigure 

go 

Esse comando vai ativar a xp cmdshell , que será necessária 

para passarmos comandos para o Windows diretamente pelo SQL 


Server! 


Além disso, vamos criar também uma tabela que receberá toda a 
informação dos passos do nosso ETL. Ela será consultada para 
sabermos se tudo rodou bem, ou se tivemos algum problema em 
algum passo. Vamos batizá-la de adm Log (dado que ela tem uma 
função administrativa do processo, que é guardar os logs dos 
processos de carga). Para isso, basta rodar o comando: 


USE [DS] 
Go 


CREATE TABLE [dbo].[Adm Log]( 
[Id Log] [uniqueidentifier] primary key NOT NULL, 
[Data] [datetime] NOT NULL, 
[Passo] [varchar](50) NOT NULL, 
[SucessoFalha] [char](1) NOT NULL, 
[mensagem] [varchar](255) NOT NULL 
) 


Uma vez criado nosso DS e nossa tabela de Log, e habilitado o 
recurso que precisaremos, vamos criar uma estrutura no nosso 
diretório para receber os arquivos de importação de dados e para 
guardá-los assim que forem importados. No nosso drive C:\ já 
havíamos criado a pasta Arquivos onde colocamos o arquivo 
chamado MassaDados2005.rpt . Basta criar uma pasta dentro de 
Arquivos com o nome de Historico : 
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Início Compartilhar Exibir 





(e T E + Meu computador » Disco Local (C:) » Arquivos » 





Nome 








Jr Favoritos 
EB Área de Trabalho [db Historico 
8 Downloads [E| MassaDados2005 


=! Locais recentes 


j&i Meu computador 


Feito isso, nosso ambiente está pronto! Podemos começar! 


4.3 MANIPULAÇÃO DE ARQUIVOS 


A primeira coisa a se fazer é importar o arquivo 
MassaDados.rpt para o SQL. Uma vez que tenhamos todo ele 
dentro da estrutura de tabelas do banco de dados, poderemos 
trabalhar com seus registros de forma mais simples. Como tivemos 
o cuidado de gerar esse arquivo com separação de colunas por |,o 
que faremos será a criação de uma tabela temporária que receberá 
todas as colunas, uma a uma, do arquivo de origem. 


Quando outras fontes de dados aparecerem, pode-se replicar 
esse processo de importação de arquivos para cada uma, tendo um 
processo para cada arquivo de origem de dados. 


Para importar o arquivo texto, precisaremos então de uma 
tabela que possa comportar as linhas com suas respectivas colunas. 
Vamos batizar essa tabela de TbImp Vendas , dado que é uma 
“Tabela de Importação dos dados de Vendas”. Para criá-la, basta 
executar o código: 


USE [DS] 
Go 
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CREATE TABLE [dbo].[TbImp Vendas]( 


[NrNf] [varchar](50) NULL, 
[Datavenda] [varchar](50) NULL, 
[Codcliente] [varchar](50) NULL, 
[NomeCliente] [varchar](50) NULL, 
[EmailcCliente] [varchar](50) NULL, 
[RegiaoVendas] [varchar](50) NULL, 
[Pais] [varchar](50) NULL, 
[GrupoGeografico] [varchar](50) NULL, 
[VendedorLogin] [varchar](50) NULL, 
[VendedorNome] [varchar](50) NULL, 
[VendedorcChefeNome] [varchar](50) NULL, 
[Cod Produto] [varchar](20) NULL, 
[Produto] [varchar](50) NULL, 
[Tamanho] [varchar](50) NULL, 
[Linha] [varchar](50) NULL, 

[Cor] [varchar](50) NULL, 
[SubTotal] [varchar](50) NULL, 
[ImpTotal] [varchar](50) NULL, 
[Frete] [varchar](50) NULL, 
[PrecoUnitario] [varchar](50) NULL, 
[Qtd] [varchar](50) NULL 


) ON [PRIMARY] 


Feita a criação da tabela, vamos criar um procedimento 


armazenado que fará os seguintes passos: 


om S p 


1. Apagar os dados da TbImp_Vendas 


carga anterior; 


Fazer o log do processo; 


com a data da importação. 


Esse procedimento será batizado de 


criado com o comando a seguir: 


USE [DS] 


GO 


Create procedure [dbo]. [Importa Vendas] 


as 


caso existam de uma 


Renomear os arquivos existentes para um nome esperado; 
Importar os dados do arquivo para o SQL; 


Copiar o arquivo para a pasta Historico , renomeando-o 


Importa Vendas e é 


4.3 MANIPULAÇÃO DE ARQUIVOS 93 


Declare @STR as nvarchar (1000) 


-- Apaga os dados da TbImp Vendas caso existam para uma nova carga; 


truncate table TbImp Vendas 


-- Renomeia arquivos existentes para um nome esperado: 
set OSTR = 'Move c:NArquivosN*.rpt c:NArquivosMassaDados.rpt' 
exec xp cmdshell (STR 


-- Importa os dados do arquivo para o SQL: 
bulk insert [dbo].[TbImp Vendas] 
from 'C:NArquivosMassaDados.rpt' 
with ( 

FIRSTROW = 3, 
FIELDTERMINATOR = '|', 
ROWTERMINATOR = '\n' 


) 


-- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'Impor 
ta MassaDados.rpt','S', 'Arquivo importado com sucesso') 


-- Copia o arquivo para a pasta “Historico”, renomeando ele com a 
data da importação: 
declare @nomearquivo varchar(50) 
Set @nomearquivo = (Select cast(year(getdate())as char(4)) 


+ right('00'+ cast(month(getdate())as varchar(2)),2)+ right('00'+ 
cast(day(getdate())as varchar(2)),2) +'_Vendas.rpt') 


Set @STR = 'move c:NArquivosXMassaDados.rpt c:NArquivosNHi 
storicol" + (nomearquivo 


exec xp cmdshell @STR 


O resultado esperado é Comando(s) concluído(s) com 


êxito. 
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Alguns comentários sobre esse comando: inserimos os dados 
pelo Bulk Insert , o processo mais performático. Para tanto, 
iniciamos a carga na terceira linha, eliminando os nomes das 


colunas ( firstrow = 3 ), e usamos o delineador de linha Enter 
( ROWTERMINATOR = An! ) e o delineador de campo 
( FIELDTERMINATOR = ']|'). 


Note que a execução foi imediata e nada foi carregado. Nós 
apenas criamos a rotina que vai fazer esse trabalho, mas ainda não a 
executamos. Para tanto, basta comandar em uma nova janela do 
Management Studio: 

USE [DS] 


GO 
exec Importa_Vendas 


Ao final da execução, devemos ter: 


1. As tabelas TbImp Vendas e Adm Log criadas, bem como 
uma Stored Procedure chamada Importa vendas : 
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=| B WIN-20Q73028G8MF\BIPRD (SQL Server 12.0.2000 - WIN-2073028G8MP 
E] Bancos de Dados 
= O Bancos de Dados do Sistema 
[E ig AdventureWorks2012 
a [5 DS 
= O Diagramas de Banco de Dados 
= CM Tabelas 
E Tabelas do Sistema 
m Dm FileTables 
= O dbo.Adm Log 
m O] dbo.Tblmp Vendas 
m EM Exibições 
a O Sinônimos 
= a 
= EM Procedimentos Armazenados 
= 3 Procedimentos Armazenados do Sistema 
= [E] dbo.lmporta Vendas 
Funções 
Gatilhos de Banco de Dados 
Assemblies 
E Tipos 
Regras 
m O Padrões 
= Sequências 
a O Service Broker 
E Armazenamento 
= O Segurança 
w B DW 
m [9 ReportServerSBIPRD 
[Ea T) ReportServerSBIPRDTempDB 


EE: 


+ 





+ 





2. Os dados na tabela  TbImp Vendas devem ter sido 
carregados. Usando nosso exemplo, teremos 5.149 linhas: 





MI Potato Dem to Ene Pego Pa mentes era Tie e aae ima 
DET MIRATO D mn a aa S mae enari Trem re my Morem 17 Bme dy “ 
O RDS ORNE e eeo Sr SO ao t Ta Dare der Martan 18 poa 3 3 
EO MD ANDi MOO e i a US ia denii Tn into ae o Morta Vi em e a 
EO D MINAN MOND me Sr se enee Term Str img Marn Soro dd “ 
i amA 4 VOS O AIN ms Pç tm o Sat A eima aena Trata ir dry tarts Som a 
bO GW dd FIA COMA MIDA eeii tc a E bi rti From Sere dar Lg co Lagos y 
AA da ROS TROS MON meei ic Baa So mt mirra) Teie Dome mg mg re go md È 
O OO ad VIRE O MODS mein a ce o a art Tua tata ro uma Mastar Bo Sacra di » 
EOOD a LES SUAS MOE ammini tm si FO oiee bet Dele Sei ar A Logo my 
No AMD da | MOS SODA PISOS is ça So US ee rm] Tem ts a Ses O ret Bm 
TO COMES TRES ANTES Mama rss Entra i E ha enmar Trato mto day Post R Pt at “ 
OMS M VEIAS ME ldioČee cocina ie UÈ oiee ionis fer gendra Peso a0 tae 17 a 
J awn da finds temia Mie ana Emos arames co “masa ma trem id] ml Sa mt ço Me Mrs fome “Hc ai dg 
Me ESA MED N iaa a meets vom Coto mia renal] dii Gm ças VE Mai Fim e a 47 
O o SM UEMA NDA aoa inns Be meaitputenr mta com Coreia RR Öre Vipa Ve Meo ia- S 
Wodi ainina aioa iana S rima Orate CA Meee sieton] DSe t aga aC too Om 
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3. O arquivo MassaDados2005.rpt deve ter desaparecido da 
pasta Arquivos , e um arquivo com a data atual e a 








terminação _Vendas.rpt deve ter surgido na pasta 
Historico : 
Início Compartilhar Exibir 
(e) meat [dá + Meu computador » Disco Local (C:) » Arquivos » Historico 
3r Favoritos eme 
EE Área de Trabalho E 20160531 Vendas 
b Downloads 


=! Locais recentes 


J% Meu computador 
(ġe Área de Trabalho 
LE] Documentos 
“a Downloads 
E Imagens 
D Músicas 
E| Vídeos 
i Disco Local (C:) 

d Arquivos 
» Historico 


Dessa forma, poderemos comandar esse procedimento para 
ocorrer toda vez que um novo arquivo for gerado com os dados de 
um novo dia. Com esse agendamento, a plataforma de BI vai sendo 
carregada constantemente, mas falaremos disso adiante, ainda neste 


capítulo! 





OBSERVAÇÃO Ao executar o procedimento Importa Vendas , o 
seu retorno pode ser o erro: 
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SALQuery 13.sql - W..dministrados (56))* 3 
use (05) 
[e 
exec Importa Vendas 





Não há motivo para pânico! Abra o arquivo MassaDados.rpt 
(com o NotePad++ ou com o bloco de notas mesmo, tanto faz) 
e digite Crtl + End para ir direto ao final do arquivo. É 
possível que você encontre o seguinte resultado (gerado por 
conta de como foi criada a massa de testes): 

75123/Jul 31 2008 12:00AM]AW00018759]Devin Phillips |devin38gadventure-t 


75123/Jul 31 2008 12:00AM|AW00018759|Devin Phillips |devin38gadventure-v 
75123/Jul 31 2008 12:00AM|AW00018759|Devin Phillips |devin38Gadventure-v 


(121317 linha(s) afetadas) 


< w 





Manualmente mesmo, apague essas três últimas linhas (as duas 
em branco e a que contém o contador de linhas afetadas). 
Feche e salve o arquivo, e execute o procedimento novamente 
com o comando: 

USE [DS] 


GO 
exec Importa_Vendas 


Dessa vez, o erro deve ter desaparecido e uma menção de que o 
arquivo foi movimentado será exibido como retorno. Com os 
dados na tabela TbImp_Vendas , o que vamos fazer é começar 
a carregar as Dimensões e depois as Fatos. Uma a uma! 


Para isso, criaremos uma tabela de “Stage” para cada dimensão, 
com os mesmos atributos das tabelas finais do nosso DW. 
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Nela, colocaremos todos os dados fazendo todos os ajustes 
necessários. A ideia é que, se um dado foi posto na entidade do 
Data Stage, ele será incluído no Data Warehouse sem 
problemas. 





4.4 CARREGANDO A DIMENSÃO DATA 


Como nossa primeira dimensão é a Data, vamos começar por 
ela. A má notícia é que não vai ser tão simples como carregar a data 
“hoje” e pronto, dado que os registros estão sendo carregados agora. 
Note que as vendas ocorreram em datas diferentes e, no nosso 
exemplo, em anos anteriores. O que precisamos é inserir no nosso 
DW as datas em que as vendas ocorreram! A boa notícia é que, 
ainda assim, é um processo bastante simples. 


Primeiro vamos criar a tabela Data na Base de Stage. Vamos 
batizá-la de D Data mesmo, dado que estará em outra base de 
dados. Como teremos de usar o nome das bases de dados nas 
consultas, não haverá confusão. Mas, novamente, se você quiser ser 
mais puritano do que eu e batizá-la com a notação DS D Data , 
fique à vontade! 


A criação da dimensão na Stage segue exatamente os conceitos 
do Data Warehouse. Então, podemos criar essa tabela usando o 
mesmo comando: 


USE [DS] 
Go 


CREATE TABLE [dbo].[D Datal( 
[Data] [date] Primary Key NOT NULL, 
[Dia] [char](2) NOT NULL, 
[Mes] [char](2) NOT NULL, 
[Ano] [char](4) NOT NULL, 


) 
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Agora faremos o comando de carga em si, que deverá responder 
pelos seguintes critérios: 


e A Data é chave primária, ou seja, não pode repetir. 
Teremos de ter sempre um único registro para cada 
Data. 

e Devemos ter a Data no formato de Date , e Ano, Mês e 
Dia separados. 

e Será uma carga sempre incremental, ou seja, serão 
carregados somente dados que não existam no DW. 
Mesmo que um novo arquivo possua uma data 
existente no arquivo que estamos carregando hoje, os 
dados não podem se repetir. 

e Se ocorrer um problema, um log de erro deve ser 
inserido. Se não, um log de sucesso deve ser inserido. 


Quanto à criação da tabela Stage, note que é importante que a 
chave primária da tabela no DW seja também chave primária no 
DS. Isso, além de garantir unicidade, garantirá uma boa 
performance na hora de carregarmos o DW. 


O comando seguinte criará um procedimento para a carga da 
D Data , desde o Data Stage até o Data Warehouse: 
USE DS 
Go 


Create procedure [dbo].[Carrega D Data] 
as 


begin try 
- Apaga os dados da D Data no Stage: 
truncate table [DS]..[D Data] 


-- Insere os dados na D Data no Stage: 
insert into [dbo].[D Data] 
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Select Distinct 

Cast (DataVenda as date) as Data, 

right('00'+ cast(Day(DataVenda)as varchar(2)),2) as Dia, 
right('00'+ cast(Month(DatavVenda)as varchar(2)),2) as Mes, 
Year (DataVenda) as Ano 

from [DS]..[TbImp Vendas] 


- Carrega os dados no DW: 
insert into [Dw]..[D Data] 
Select 
ds.data, 
ds.Dia, 
ds.Mes, 
ds.Ano 
from [DS]..[D Data] as ds left join [Dw]..[D Data] as dw 
on ds.Data = dw.Data 
where dw.Data is null 


-- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 


mporta Data','S', 'Carga de D Data com sucesso. ') 


end try 
begin catch 

- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'Impor 
ta Data!,'F', 'Erro ao carregar D Data.') 
end catch 


Algumas observações: 


e Sempre apagamos a tabela do DS para iniciar uma 
carga sem resquícios de cargas anteriores. 

e À transformação e (quando houver) validação dos 
dados ocorrem na inserção na tabela do DS. Quando os 
dados forem ser inseridos no DW, já deverão estar ok. 

e Quando fazemos left join do DS com o DW e 
incluímos a condição where de que uma coluna do 
DW seja nula, estamos na verdade efetuando uma carga 
incremental! Ou seja, vamos buscar todos os dados do 
DS desde que a igualdade dele no DW seja nula. 
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Execute o procedimento Carrega D Data duas vezes seguidas! 
Note que, na primeira, seu retorno é: 








SQLQueny8.sql - Wl...Administrador (53))* x 


Use DS 
Go 


Exec |[dbo]. [Carrega D Data] 


100% ~< 


Ea Mensagens | 





(181 linha(s) afetadas) 
(181 linha(s) afetadas) 


(1 linha(s) afetadas) 


Ou seja, foram 181 linhas inseridas na tabela D Data do Stage, 
depois 181 linhas inseridas no DW (afinal, a Dimensão D Data do 
DW estava vazia) e mais uma linha inserida na tabela de Log! Na 
segunda vez, o retorno será: 


SQLQueny8.sq! - Wi...Administrador (53)* x [HS 


Use DS 
Go 





Exec |[dbo]. [Carrega D Data] 


100% =~|< 


Hà Mensagens | 





(181 linha(s) afetadas) 
(0 linha(s) afetadas) 


(1 linha(s) afetadas) 
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Ou seja, foram 181 linhas inseridas na tabela D Data do Stage, 
depois zero linhas inseridas no DW (afinal, a Dimensão D Data 
do DW agora contém todas as datas que temos na tabela TbImp ) e 
mais uma linha inserida na tabela de Log! A carga da D Data foi 
concluída com sucesso! 


4.5 CARREGANDO A DIMENSÃO CLIENTE 


Feita a carga dos dados temporais, vamos criar a carga da 
dimensão cliente . Das dimensões, ela é a mais simples de 
carregar, por isso é um bom começo para avaliarmos o conceito da 
chave artificial que veremos à seguir. 


De forma análoga à carga anterior, criaremos a tabela que 
conterá os dados de Cliente no DataStage, usando o comando de 
criação igual ao do DW: 


USE DS 
Go 


CREATE TABLE [dbo].[D Cliente]( 
[Cod Cliente] [varchar](10) NOT NULL, 
[Nome] [varchar](50) NOT NULL, 
[Email] [varchar](50) NOT NULL, 
[LinData] [date] NOT NULL, 
[Linorig] [varchar](50) NOT NULL 
) 
Go 
create index IX Cod Cliente on DS..D Cliente (Cod Cliente) 
GO 
create index IX Cod Cliente on DW..D Cliente (Cod Cliente) 


Agora faremos o comando de carga em si, que deverá responder 
pelos seguintes critérios: 


e Teremos um Id Cliente que não existe no arquivo 
original. É a chave artificial que, como vimos 
anteriormente, recebe o nome de Surrogate Key. Essa 
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chave será criada de forma incremental. Note que ela 
não existe no DS. Por ser incremental, ela apenas 
existirá no destino do DW (por isso as surrogate foram 
criadas como Identity ). 

e O código do Cliente, seu nome e seu e-mail serão 
carregados e atrelados a essa surrogate. 

e Teremos de colocar a fonte do dado e a data em que ele 
entrou para nossa Base, como recurso de Data Lineage. 

e E, como sempre, se ocorrer um problema, um log de 
erro deve ser inserido. Se não, um log de sucesso deve 
ser inserido. 


Diferentemente da Data, é importante que o código do cliente 
seja indexado tanto no DataStage quanto no DataWarehouse, e não 
uma Primary Key (que não existirá na tabela de Stage). Isso 
garantirá a performance da carga, uma vez que precisamos verificar 
se trata-se ou não de um registro novo justamente por esse campo. 


Quando temos uma chave primária, temos automaticamente um 
índice (na verdade, o tipo de índice mais performático, o chamado 
Índice Cluster). Quando não estamos usando uma chave primária 
para a pesquisa, como é o caso do código do cliente, temos de criar 
manualmente o índice para tornar a consulta mais rápida (e quando 
criamos um índice que não é a chave primária, temos o índice não- 
cluster, menos performático, mas ainda muito melhor do que não 
ter índice algum). 


O comando seguinte vai criar um procedimento para a carga da 
D Cliente , desde o Data Stage até o Data Warehouse: 
USE [DS] 
G0 


Create procedure [dbo].[Carrega D Cliente] 
as 
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begin try 
-- Apaga os dados da D Cliente no Stage: 
truncate table [DS]..[D Cliente] 


-- Insere os dados na D Cliente no Stage: 
insert into [dbo].[D Cliente] 

Select Distinct 

Codcliente as [Cod Cliente], 
NomeCliente as [Nome], 

EmailCliente as [Email], 

Getdate() as [LinData], 

'Arquivo de Vendas! as [LinOrig] 

from [DS]..[TbImp Vendas] 


-- Carrega os dados no DW: 

insert into [Dw]..[D Cliente] 
Select 

ds.Cod Cliente, 

ds.Nome, 

ds. Email, 

ds.LinData, 

ds.LinOrig 

from [DS]..[D Cliente] as ds left join [Dw]..[D Cliente] as dw 
on ds.Cod Cliente = dw.Cod Cliente 
where dw.ID Cliente is null 


-- Faz o log do processo: 
insert into [dbo]. [Adm Log] values (newid(), getdate(), 'I 
mporta Cliente','S!', "Carga de D Cliente com sucesso.'") 


end try 
begin catch 
-- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'Impor 
ta Cliente", 'F', 'Erro ao carregar D Cliente.') 
end catch 


Mais uma vez, como na carga de Data, se executarmos essa 
procedure duas vezes seguidas, teremos os registros carregados na 
primeira execução e nenhum carregado na segunda (pois os dados 
não podem se repetir). 
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Verifique conforme a figura a seguir que o Id Cliente , nossa 
surrogate, foi devidamente preenchida na base do DW, mesmo sem 
ter sido mencionada no nosso procedimento de carga. Isso se deve 
ao Identity que determinamos. Ele carrega automaticamente a 
coluna com um numerador sequencial. 





ES Resultados [Ha “Mensagens | e À E aos 
ld Cliente Cod Cliente Nome Email LinData LinOrig 

1 1 AW00011000 Jon Yang jon24@adventure-works.com 2016-05-31 Arquivo de Vendas 
2 2 AW00011001 Eugene Huang eugene 10@adventure-works.com 2016-05-31 Arquivo de Vendas 
3 3 AW00011002 Ruben Tores ruben35@adventure-works.com 2016-05-31 Arquivo de Vendas 
4 4 AW00011003 Christy Zhu christy 12@adventure-works.com 2016-05-31 Arquivo de Vendas 
5 5 AW00011004 Elizabeth Johnson elizabeth5@adventure-works.com 2016-05-31 Arquivo de Vendas 
6 6 AW00011005 Julio Ruiz julio 1Gadventure-works.com 2016-05-31 Arquivo de Vendas 
7 7 AW00D11006 Janet Alvarez janet9€Gadventure-works.com 2016-05-31 Arquivo de Vendas 
8 8 AW00011007 Marco Mehta marco 14@adventure-works.com 2016-05-31 Arquivo de Vendas 
9 9 AW00011008 Rob Verhoff rob4@adventure-works.com 2016-05-31 Arquivo de Vendas 
10 10 AW00011009 Shannon Carlson shannon38@adventure-works.com 2016-05-31 Arquivo de Vendas 
11 1 AW00011010 Jacquelyn Suarez jacquelyn20@adventure-works.com 2016-05-31 Arquivo de Vendas 
iz az AW00011011 Curtis Lu curtis9Gadventure-works.com 2016-05-31 Arquivo de Vendas 
E. t AW00011017 Shannon Wang shannon 1 Gadventure-works.com 2016-05-31 Arquivo de Vendas 
14 14 AW00011018 Clarence Rai clarence32@adventure-works.com 2016-05-31 Arquivo de Vendas 
15 tb AW00011025 Alejandro Beck alejandro45Gadventure-works.com 2016-05-31 Arquivo de Vendas 
16 16 AWINMANDA Hamid Sai hamid Uadventire-wnrks com MENA  Armiva de Vendas 


Também temos quando ele entrou no nosso DW e de onde ele 
veio para cada um dos valores carregados! Isso poderá ser de grande 
valia quando formos confrontar os dados do BI com os 
apresentados pelas demais fontes e em auditorias futuras. Como 
temos a origem e a data, podemos facilmente acessar a pasta 

Historico dos nossos arquivos e achar o arquivo que originou a 
informação pela data dele, ou seja, arquivo de Vendas do dia 
31.05.2016 : 


| Arauiva | Inicio Compartilhar Exibir 

















© 4 m + Meu computador » Disco Local (C:) » Arquivos » Historico 
Jr Favoritos pare 
EE Área de Trabalho B 20160531_Vendas 
“8 Downloads 


; . 
=) Locais recentes 
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4.6 CARREGANDO A DIMENSÃO GEOGRAFIA 


Dado que temos a Data e o Cliente, que são as cargas mais 
simples, vamos passar para um movimento mais “complexo”. A 
ideia da dimensão Geografia é de carregarmos todas as tabelas em 
um único procedimento. 


Novamente, sinta-se à vontade para discordar de mim e carregar 
uma em cada procedimento! A diferença será apenas a de termos 
mais ou menos procedimentos armazenados. Porém, os códigos em 
cada um e a ordem de execução serão exatamente iguais por uma 
imposição das chaves estrangeiras do DW. Eu opto por mantê-los 
todos juntos por uma simples questão de simplificar a execução (um 
único comando por dimensão). 


Assim sendo, vamos construir as tabelas do nosso DS que 
receberão os dados geográficos bem como os índices para 
mantermos uma boa performance no processo de carga. Seguindo o 
nosso modelo, serão três tabelas: 


USE [DS] 
Go 


CREATE TABLE [dbo].[D GrupoGeografico] 
( 
[Nome] [varchar](50) NOT NULL, 
[LinData] [date] NOT NULL, 
[Linorig] [varchar](50) NOT NULL 
) 
GO 
create index IX D GrupoGeografico nome on DS..D GrupoGeografico ([ 
Nome]) 
create index IX D GrupoGeografico nome on DW..D GrupoGeografico (T 
Nome]) 
GO 


CREATE TABLE [dbo].[D_Pais] 


( 
[Id GrupoGeo] [int] NOT NULL, 
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[Sigla] [char](2) NOT NULL, 
[LinData] [date] NOT NULL, 
[Lin0rig] [varchar](50) NOT NULL 


) 


Go 

create index IX D PaisIdGrupo on DS..D Pais ([Id GrupoGeo]) 
create index IX D PaisSigla on DS..D Pais ([Sigla]) 
create index IX D PaisSigla on DW..D Pais ([Sigla]) 

Go 


CREATE TABLE [dbo].[D RegiaoVendas] 
( 
[Id Pais] [int] NOT NULL, 
[Nome] [varchar](20) NOT NULL, 
[LinData] [date] NOT NULL, 
[Linorig] [varchar](50) NOT NULL 


) 
G0 


create index IX D RegiaoIdPais on DS..D RegiaoVendas ([Id Pais]) 
create index IX D RegiaoNome on DS..D RegiaoVendas ([Nome]) 
create index IX D RegiaoNome on DW..D RegiaoVendas ([Nome]) 


Go 


Agora faremos o comando de carga em si, que deverá responder 
pelos seguintes critérios: 


e Teremos de carregar os dados na ordem do menos 
granular para o mais granular, pois temos dependência 
dos registros. Ou seja, para inserir uma região de 
vendas, ela deve pertencer a um País previamente 
carregado! Essa ordenação fará com que carreguemos o 
DS e o DW para cada uma das tabelas para depois 
seguir para a próxima, até finalizarmos! 

e Da mesma forma que a D Cliente , a chave de cada 
tabela será artificialmente criada por um 
autonumerador, a nossa Surrogate Key. 

e Teremos de colocar a fonte do dado e a data em que ele 
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entrou para nossa base, como recurso de Lineage para 
cada uma das tabelas. 

e E, como sempre, se ocorrer um problema, um log de 
erro deve ser inserido. Se não, um log de sucesso deve 
ser inserido. 


Note no comando que indexamos os nomes (por onde as buscas 
ocorrerão) e as chaves das tabelas “Pai”. Essas últimas não foram 
indexadas no DW, porque já fizemos isso quando criamos as tabelas 
dele. Uma das regras da boa performance é que as chaves 
estrangeiras sejam sempre indexadas! 


O comando criará um procedimento para a carga das tabelas de 
Geografia, desde o Data Stage até o Data Warehouse: 


USE [DS] 
Go 


Create procedure [dbo].[Carrega D Geografia] 
as 


begin try 
-- Apaga os dados das tabelas no Stage: 
truncate table [DS]..[D GrupoGeografico] 
truncate table [DS]..[D Pais] 
truncate table [DS]..[D RegiaoVendas] 


-- Insere os dados na D GrupoGeografico no Stage: 
insert into [dbo].[D GrupoGeografico] 

Select Distinct 

GrupoGeografico, 

Getdate() as [LinData], 

'Arquivo de Vendas' as [LinOrig] 

from [DS]..[TbImp Vendas] 


- Carrega os dados no DW: 
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insert into [Dw]..[D GrupoGeografico] 

Select Distinct 

ds. Nome, 

ds.LinData, 

ds.LinOrig 

from [DS]..[D GrupoGeografico] as ds left join DW..D GrupoGeog 
rafico as dw 

on ds. [Nome] =dw. [Nome] 

Where dw. [Id GrupoGeo] is null 


-- Insere os dados na D Pais do Stage: 

insert into [dbo].[D Pais] 

Select Distinct 

dw. Id GrupoGeo, 

ds.Pais, 

Getdate() as [LinData], 

'Arquivo de Vendas! as [LinOrig] 

from [DS]..[TbImp Vendas] as ds inner join [DW]..[D GrupoGeogr 
afico] as dw 

on ds.GrupoGeografico = dw.Nome 


-- Carrega os dados no DW: 

insert into [Dw]..[D Pais] 

select 

ds. [Id GrupoGeo], 

ds. [Sigla], 

ds. [LinData], 

ds. [LinOrig] 

from [DS]..[D Pais] as ds left join [Dw]..[D Pais] as dw 
on ds.Id GrupoGeo = dw.Id GrupoGeo 
and ds.Sigla = dw.Sigla 

Where dw.Id Pais is null 


-- Insere os dados na D RegiaoVendas do Stage: 
insert into [dbo].[D RegiaoVendas] 

select Distinct 

dw.Id Pais, 
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ds.RegiaoVendas, 

Getdate() as [LinData], 

"Arquivo de Vendas! as [LinOrig] 

from [DS]..[TbImp Vendas] as ds inner join [DwW]..[D Pais] as d 


on ds.Pais = dw. [Sigla] 


-- Carrega os dados no DW 

insert into [Dw]..[D RegiaoVendas] 

Select 

ds. [Id Pais], 

ds. [Nome], 

ds. [LinData], 

ds. [LinOrig] 

from [DS]..[D Regiaovendas] as ds left join [Dw]..[D RegiaoVen 
das] as dw 

on ds.Id Pais = dw.Id Pais 

and ds.Nome = dw. Nome 

where dw.Id RegiaoVendas is null 


-- Faz o log do processo: 
insert into [dbo]. [Adm Log] values (newid(), getdate(), 'I 
mporta Geografia','S', 'Carga das tabelas de Geografia com sucesso 


o) 


end try 
begin catch 
-- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'Impor 
ta Geografia", 'F', 'Erro ao carregar tabelas de Geografia.') 
end catch 


Esse processo de carga se mostra um pouco mais complexo 
apenas por termos de capturar o valor da surrogate no DW da 
tabela Pai antes de carregarmos os dados da tabela Filho. Esse passo 
que fazemos para preencher os dados ainda no Stage garante que 
teremos a tabela Filho com a devida surrogate quando a enviarmos 
para o DW. A indexação se faz necessária por conta das cargas do 
dia a dia que podem ter muitos e muitos registros, mesmo tratando- 
se de dimensões (que dificilmente superam as centenas de 
registros). 
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O fato de efetuarmos três cargas em um mesmo procedimento, 
mais uma vez, é apenas para centralizarmos a codificação de um 
mesmo “tema”. Se você achar melhor dividila em três 
procedimentos distintos por achar que unificados o procedimento 
fica mais complexo, não há nenhum impedimento. 


Para entender o resultado, execute a Carrega D Geografia e, 
em seguida, rode o comando: 


select 

a. [Nome] as RegGeo, 

b. [Sigla] as Pais, 

c. [Nome] as RegVendas 

from [D GrupoGeografico] as a inner join [D Pais] as b 
on a. [Id GrupoGeo] = b.[Id GrupoGeo] 

inner join [dbo].[D RegiaoVendas] as c 

on b.[Id Pais] = c.[Id Pais] 


Unindo as tabelas por suas chaves, tem-se a estrutura geográfica 
completa: 


E Resultados UA Mensagens 





RegGeo Pais RegVendas 
- EE E Ra 
A jr SERA ES ES 
3 Europe GB United Kingdom 
4 North America CA Canada 
5 North America US Central 
6 North America US Northeast 
7 North America US Northwest 
8 North America US Southeast 
9 North America US Southwest 
10 Pacific AU Australia 


Quando usarmos a Região Vendas (informação mais granular) 
nas Fatos, poderemos saber também o País e a Região Geográfica 
(informações menos granulares)! 
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4.7 CARREGANDO A DIMENSÃO 
FUNCIONÁRIO 


Como vimos no projeto do DW, os nossos vendedores serão 
postos em uma dimensão do tipo parent-child. Esse conceito pode 
ser usado em todas as dimensões que são organizadas de forma 
hierárquica, como pastas na árvore de diretórios de nossos 
computadores. Podem ser dimensões de Organograma, como a 
nossa Funcionário, Plano de Contas contábeis e gerenciais etc. 


O interessante desse conceito é que ele pode formar uma árvore 
hierárquica infinita e complexa de forma extremamente simples: 
basta informar no registro, qual o Id do registro superior. E a 
carga é tão simples quanto o conceito! 


Primeiramente, vamos criar a tabela D_Funcionario no nosso 
DS e os respectivos índices: 


USE [DS] 
Go 


CREATE TABLE [dbo].[D Funcionario]( 
[Nome] [varchar](50) NOT NULL, 
[Login] [varchar](50) NOT NULL, 
[Id Chefe] [int] NULL, 

[LinData] [date] NOT NULL, 
[Linorig] [varchar](50) NOT NULL 
) 


create index IX FuncionarioLogin on [DS]..[D Funcionario]([Login]) 
create index IX FuncionarioLogin on [DwW]..[D Funcionario]([Login]) 


Agora faremos o comando de carga em si, que deverá responder 
pelos seguintes critérios: 


e Teremos de carregar os dados dos funcionários, 
deixando a informação de Chefe em branco. Isso 
porque os “chefes” deverão já estar carregados e ter 
assim recebido sua surrogate, a fim de que possamos 
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atribuí-la a cada funcionário. 


e Precisamos fazer um “update” na coluna Id Chefe 
que está em branco para vincular com o respectivo 
chefe para cada funcionário, deixando null se ele não 
tiver chefe. 


e Teremos de colocar a fonte do dado e a data em que ele 
entrou para nossa base, como recurso de Lineage para 
cada registro. 


e E, como sempre, se ocorrer um problema, um log de 
erro deve ser inserido. Se não, um log de sucesso deve 
ser inserido. 


O comando a seguir criará um procedimento para a carga da 
tabela de Funcionário, desde o Data Stage até o Data Warehouse: 


USE [DS] 
Go 


Create procedure [dbo].[Carrega D Funcionario] 
as 


begin try 
-- Apaga os dados da D Funcionario no Stage: 
truncate table [DS]..[D Funcionario] 


-- Insere os dados na D Funcionario no Stage: 
insert into [dbo].[D Funcionario] 

( [Nome], [Login], [LinData], [LinOrig]) 

Select Distinct 

Vendedor Nome, 

VendedorLogin, 

Getdate() as [LinData], 

'Arquivo de Vendas! as [LinOrig] 

from [DS]..[TbImp Vendas] 


-- Carrega os dados no DW: 
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insert into [Dw]..[D Funcionario] 

Select 

ds. [Nome], 

ds. [Login], 

ds. [Id Chefe], 

ds. [LinData], 

ds. [LinOrig] 

from [DS]..[D Funcionario] as ds left join [DW]..[D Funcionari 


o] as dw 


on ds. [Login] = dw. [Login] 
where dw.Id Funcionario is null 


-- Atualiza o Id Chefe no DW: 

declare QId funcionario int 

declare (QLoginFuncionario varchar(50) 
declare (QNomeFuncionario varchar (50) 
declare (NomeChefe varchar(50) 
declare QId Chefe int 


declare cur AtualizaChefe cursor for 


Select Id Funcionario, Login, Nome from DW..D Funcionario 


Open cur AtualizaChefe 

fetch next from cur AtualizaChefe into QId funcionario, (QLogin 
Funcionario, (QNomeFuncionario 

while QOFETCH STATUS = O 


ario 


prorpio 


Begin 
-- determina o nome do Chefe: 
Set (QNomeChefe = (Select Distinct VendedorChefeNome 
from [DS]..[TbImp Vendas] as b 
where b.VendedorLogin = QLoginFuncion 


) 


-- Determina o ID do Chefe: 
Set QId Chefe = (Select Id Funcionario 
from [Dw]..[D Funcionariolas b 
where b.Nome = (QNomeChefe 


) 


-- Determina o ID do Chefe: 


If (QNomeChefe != (QNomeFuncionario -- A pessoa não é o 
chefe (quem não tem chefe) 
Begin 


update [Dw]..[D Funcionario] 
Set Id Chefe = QId Chefe 
where Id Funcionario = QId funcionario 
End 
fetch next from cur AtualizaChefe into QId funcionario, OLo 
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ginFuncionario, QNomeFuncionario 
end 
close cur AtualizaChefe 
deallocate cur AtualizaChefe 


-- Faz o log do processo: 
insert into [dbo]. [Adm Log] values (newid(), getdate(), 'I 
mporta Funcionario'",'S', 'Carga de D Funcionario com sucesso.') 


end try 
begin catch 
-- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'Impor 
ta Funcionario','F', "Erro ao carregar D Funcionario.') 
end catch 


O resultado dessa carga será conforme a consulta: 


E3 Resultados [Ea Mensagens | 








ld Funcionario Nome Login ld Chefe LinData LinOrig 
1 1 Michael Blythe adventure-worksmichaelS 13 2016-05-31 Arquivo de Vendas 
2 2 Linda Mitchell adventure-worksNinda3 13 2016-05-31 Arquivo de Vendas 
3 3 Lynn Tsoflias adventure-works YynnD 13 2016-05-31 Arquivo de Vendas 
4 4 Rachel Valdez adventure-works'rachelO NULL 2016-05-31 Arquivo de Vendas 
5 5 JosÚ Saraiva adventure-works^josÚ1 13 2016-05-31 Arquivo de Vendas 
6 6 David Campbell adventure-works'david8 18 2016-05-31 Arquivo de Vendas 
7 7 dillian Carson adventure-works`jillian0 18 2016-05-31 Arquivo de Vendas 
8 8 Ranjit Varkey Chudukatil adventure-works\ranjit0 7 2016-05-31 Arquivo de Vendas 
9 9 Tsvi Reiter adventure-works'tsviD 10 2016-05-31 Arquivo de Vendas 
10 10 Stephen Jiang adventure-works\stephen0 1 2016-05-31 Arquivo de Vendas 
11 1 Sistema Sistema NULL 2016-05-31 Arquivo de Vendas 
12.12 Jae Pak adventure-works'jae0 18 2016-05-31 Arquivo de Vendas 


Note que o Id Chefe ficou nulo para a Rachel Valdez e para 
Sistema. Ambos os usuários que não possuem chefes. Os demais 
possuem o Id do seu respectivo chefe! 


4.8 CARREGANDO A DIMENSÃO PRODUTO 


Essa talvez seja o processo mais complexo. Ainda assim, não 
teremos nenhuma grande dificuldade a não ser a de seguir um passo 
a passo correto para a carga dessa que é uma dimensão que pode 
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sofrer alterações ao longo do tempo. 


Primeiramente, precisamos entender qual alteração que 
levaremos em consideração. No nosso exemplo, o que queremos é 
que o nome do produto seja tratado como alteração. Isto é, se um 
mesmo produto receber um novo nome, teremos de estar 
preparados para capturar essa alteração. Como vimos no desenho 
do DW, tem-se mais de uma forma de se resolver essa questão, mas 
partimos para a chamada 2SCD. 


Primeiramente, vamos criar a tabela no DataStage a fim de 
receber os dados de produto da nossa origem com os seus índices: 


USE [DS] 
Go 


CREATE TABLE [dbo].[D Produto]( 
[Cod Produto] [varchar](20) NOT NULL, 
[Nome] [varchar](50) NOT NULL, 
[Tamanho] [varchar](5) NOT NULL, 
[Cor] [varchar](20) NOT NULL, 
[Ativo] [char](1) NOT NULL, 
[LinData] [date] NOT NULL, 
[Linorig] [varchar](50) NOT NULL 
) 
Go 
create index IX ProdutoNM on DS..D Produto (nome) 
create index IX ProdutoNM on DW..D Produto (nome) 
create index IX ProdutoCod on DS..D Produto (Cod Produto) 
create index IX ProdutoCod on DW..D Produto (Cod Produto) 


Agora faremos o comando de carga em si, que deverá responder 
pelos seguintes critérios: 


e Teremos de carregar os dados de novos produtos 
normalmente, fazendo com que a coluna de ATIVO 
permaneça como SIM. 

e Precisaremos fazer um update na coluna NOME se 
ocorrer de um produto receber um novo nome para um 
mesmo Cod Produto . 
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e Teremos de colocar a fonte do dado e a data em que ele 
entrou para nossa base, como recurso de Lineage para 
cada registro. 

e E, como sempre, se ocorrer um problema, um log de 
erro deve ser inserido. Se não, um log de sucesso deve 
ser inserido. 


O seguinte comando vai criar um procedimento para a carga da 
tabela de Produto, desde o Data Stage até o Data Warehouse, 
atualizando o produto se necessário: 


USE [DS] 
GO 


Create procedure [dbo].[Carrega D Produto] 
as 


begin try 
-- Apaga os dados da D Produto no Stage: 
truncate table [DS]..[D Produto] 


- Insere os dados na D Produto no Stage: 
insert into [dbo].[D Produto] 
Select Distinct 
Cod Produto as [Cod Produto], 
Produto as [Nome], 
Tamanho as [Tamanho], 

Cor as [Cor], 

Ativo =1, 

Getdate() as [LinData], 

'Arquivo de Vendas! as [LinOrig] 
from [DS]..[TbImp Vendas] 


- Carrega os dados no DW com os novos produtos (novo COD PROD 
UTO): 
insert into DW..D Produto 
Select 
ds.Cod Produto, 
ds. Nome, 
ds.Tamanho, 
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ds.Cor, 

ds.Ativo, 

ds. LinData, 

ds. LinOrig 

from [DS]..[D Produto] as ds left join [Dw]..[D Produto] as dw 
on ds.Cod Produto = dw.Cod Produto 

where dw.Cod Produto is null 


-- Atualiza os Produtos que vieram com nome diferente (mas que 
possuem o mesmo COD PRODUTO): 
declare (CodProduto varchar(20) 
declare (NomeProduto varchar(50) 
declare (QTamanho varchar(5) 
declare (Cor varchar(20) 
declare QLinData date 
declare QLinOrigem Varchar(50) 
declare cur AtualizaProduto cursor for 
Select ds.Cod Produto, ds.Nome, ds.tamanho, ds.cor, ds.Lin 
Data, ds.LinOrig 
from DS..D Produto as ds left join DW..D Produto as dw 
on ds.Cod Produto = dw.Cod produto 
where ds.Nome != dw.Nome 
and dw.Ativo = 1 
Open cur AtualizaProduto 
fetch next from cur AtualizaProduto into (QCodProduto, (QNomePro 
duto, (QTamanho, (Cor, (QLinData, (QLinOrigem 
while QOFETCH STATUS = 0 
Begin 
-- Inativa o Produto com nome antigo: 
update dw..D Produto 
set Ativo = 0 
where Cod Produto = (QCodProduto 


-- insere o registro com os novos dados: 
insert into DW..D Produto values ((QCodProduto, QNomePro 
duto, QGTamanho, QCor, 1, QLinData, (QLinOrigem) 


fetch next from cur AtualizaProduto into (QCodProduto, (QNom 
eProduto, (QTamanho, (Cor, QLinData, QLinOrigem 
end 
close cur AtualizaProduto 
deallocate cur AtualizaProduto 


-- Faz o log do processo: 
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insert into [dbo].[Adm Log] values (newid(), getdate(), 'Impor 
ta Produto'",'S', 'Carga de D Produto com sucesso.'!) 


end try 
begin catch 
-- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'Impor 
ta Produto", 'F', 'Erro ao carregar D Produto.'") 
end catch 


Ao carregarmos os produtos — por ser a primeira carga —, não 
teremos nenhuma alteração de nome, então serão 60 produtos 
carregados e uma linha inserida no Log. Quando formos efetuar a 
carga dos próximos arquivos (dos demais anos que existem na nossa 
origem), faremos uma alteração no nome de um dos produtos a fim 
de testar a 2SCD. 


Com isso, temos todas as nossas dimensões carregadas! 


4.9 CARREGANDO A FATO DE VENDA 


Finalizada a carga das dimensões, vamos carregar nossa Fato, a 
primeira de duas que temos em nosso DW. Teremos que começar 
pela Fato de Venda, dado que os registros dela serão “pais” da tabela 
detalhada de Vendas, o que nos impossibilitaria de carregarmos a 
Fato Venda Detalhes primeiramente. 


Antes de iniciarmos a criação da nossa tabela no Stage, vamos 
recordar o primeiro dos conceitos do DW. Nenhuma coluna pode 
aceitar null . Se um dado veio nulo, o processo de carga deve 
entender se é algo esperado ou um erro. Deve-se preencher o campo 
com uma informação genérica para que se saiba que aquele dado 
não foi carregado. Essa prática resolve muitos problemas de origens 
de dados incoerentes. Isso quer dizer que temos de impedir que um 
dado da Fato venha com um nulo ou que, pior ainda, deixe de ser 
carregado (tornando os números incorretos). 
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Para darmos esse tratamento, vamos inserir um registro 
genérico em cada uma das dimensões. Ou seja, se tiver ocorrido 
qualquer problema na carga de uma dimensão e não houver uma 
relação válida entre o Fato e essa Dimensão, um registro genérico 
será atribuído, a fim de se manter os valores coerentes. 


Explicando melhor: imagine que, por um erro, um Vendedor 
não foi carregado na Dimensão. Quando formos carregar a Fato, 
precisaríamos deixar de fora todas as vendas dele (já que temos uma 
relação de chave estrangeira entre a Fato e as dimensões). Com isso, 
o total de vendas da nossa empresa estaria errado no BI! Para evitar 
esse problema, vamos colocar um vendedor “Genérico”. Mesmo que 
não se tenha a informação correta de quem fez a venda, ela não vai 
deixar de constar em nossos números! 


Para tanto, o script a seguir fará essa inserção. E teremos de 
colocar esse registro em cada nova dimensão conforme o DW for 


crescendo: 

Use DW 

GO 

Insert into D Cliente values ('999999'", 'Não Aplica", 'Não 
Aplica', Getdate(), 'Registro padrão inserido manualmente"); 
Insert into D Data values ('1900/01/01', '01','01','1 
900"); 

Insert into D Funcionario values ('Não Aplica','Não Aplica',n 


ull, Getdate(), 'Registro padrão inserido manualmente"); 

Insert into D GrupoGeografico values ('Não Aplica', Getdate(), 'Re 
gistro padrão inserido manualmente '); 

Insert into D Pais values ((select Id GrupoGeo from D 
-GrupoGeografico where Nome = 'Não Aplica'), 'XX', Getdate(), 'Reg 
istro padrão inserido manualmente"); 

Insert into D RegiaoVendas values ((select Id Pais from D Pais 

where Sigla = 'XX'), 'Não Aplica', Getdate(), 'Registro padrão ins 
erido manualmente"); 

Insert into D Produto values ('999999', 'Não Aplica','NA', 
'NA','1', Getdate(), 'Registro padrão inserido manualmente"); 


Devemos ter em mãos as chaves geradas para cada um desses 
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registros, a fim de colocá-las no processo de carga das Fatos. Assim, 
usaremos s função Isnull que ditará: se o valor da surrogate da 
dimensão vier nulo, traga o valor do genérico. 


Dessa forma, nunca deixaremos de contar com todos os valores 
e, de quebra, poderemos verificar nas sumarizações os registros com 
esses valores para atuarmos nos erros de carga (se houver). 


CUIDADO 


Coloque como código dos dados genéricos apenas informações 
que, com certeza, não existam na realidade. Por exemplo, usar 
o dia 01/01/2020 como genérica para a D Data é um erro, 
pois existirão vendas reais nesse dia, e elas seriam misturadas 
com as vendas cujas datas não foram estipuladas. Use sempre 


informações bastante diferentes das possíveis (por exemplo, 
01/01/1900 para a Data!) 





Vamos então criar a estrutura no nosso DS. E como a Fato não 
receberá uma surrogate própria, ela será exatamente igual à 
estrutura do DW. Para isso, vamos rodar o comando: 


USE [DS] 
GO 
CREATE TABLE [dbo].[F Venda]( 
[Data] [date] NOT NULL, 
[Nr NF] [varchar](10) NOT NULL, 
[Id Cliente] [int] NOT NULL, 
[Id Funcionario] [int] NOT NULL, 
[Id RegiaoVendas] [int] NOT NULL, 
[Vlr Imposto] [decimal](18, 2) NOT NULL, 
[Vir Frete] [decimal](18, 2) NOT NULL, 
[LinData] [date] NOT NULL, 
[LinOrig] [varchar](50) NOT NULL, 
CONSTRAINT [PK F Venda] PRIMARY KEY CLUSTERED 


( 
[Data] ASC, 
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[Nr NF] ASC, 

[Id Cliente] ASC, 

[Id Funcionario] ASC, 
[Id RegiaoVendas] ASC 


) 


Agora faremos o comando de carga em si, que deverá responder 
pelos seguintes critérios: Selecionar todos os dados de venda; 


e Atribuir a cada dimensão, sua surrogate, mesmo que 
seja a dos registros genéricos. 

e Avaliar se o dado já existe ou não na Fato do DW e 
carregar apenas os novos registros. 

e Teremos de colocar a fonte do dado e a data em que ele 
entrou para nossa base, como recurso de Lineage para 
cada registro. 

e E, como sempre, se ocorrer um problema, um log de 
erro deve ser inserido. Se não, um log de sucesso deve 
ser inserido. 


O comando vai criar um procedimento para a carga da tabela de 
Fato Vendas, desde o Data Stage até o Data Warehouse: 


USE [DS] 
Go 


Create Procedure [dbo].[Carrega F Venda] 
as 


begin try 
- Apaga os dados da F Vendas no Stage: 
truncate table [DS]..[F Venda] 


- Insere os dados na F Vendas no Stage: 
- Determina os "Ids" dos Genéricos: 
declare QidclienteGenerico int = (Select Id Cliente from D 
W..D Cliente where Cod Cliente = '999999') 
declare (GidFuncionarioGenerico int = (Select ID Funcionari 
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o from DW..D Funcionario where Login = 'Não Aplica") 
declare (QidRegiaoGenerico int = (Select Id RegiaoVendas fr 
om DW..D RegiaoVendas where Nome = 'Não Aplica') 


insert into DS..F Venda 


Select 
Data, 
Nr. NF, 


Id Cliente, 

Id Funcionario, 
Id RegiaoVendas, 
sum(Vlr. Imposto), 
sum(Vlr Frete), 


Getdate() 
"Arquivo 
from( 


as [LinData], 
de Vendas" as [LinOrig] 


Select Distinct 

isnull(a.DataVenda, '1900/01/01') as Data, 

isnull (a.NrNf, '000000') as Nr NF, 

isnull(c.Id Cliente, QidclienteGenerico) as Id Cliente 


isnull(d.Id Funcionario, (QidFuncionarioGenerico) as Id 


isnull(e.Id RegiaoVendas, (QidRegiaoGenerico) as Id Reg 


cast(ImpTotal as decimal(18,2)) as Vlr Imposto, 
cast(Frete as decimal(18,2)) as [Vlr Frete] 


_Funcionario, 
iaoVendas, 
from 
on a. 
left 
on a. 
left 
on a. 
left 
on a. 
) as 
group by 
Data, 
Nr_NF, 


DS..TbImp_Vendas as a Left join DW..D Data as b 
DataVenda = b.Data 

join DW..D_Cliente as c 

CodCliente = c.Cod_Cliente 

join DW..D_Funcionario as d 

VendedorLogin = d.Login 

join DW..D_RegiaoVendas as e 

RegiaoVendas = e.Nome 

x 


Id Cliente, 
Id Funcionario, 
Id RegiaoVendas 


-- Carrega os dados no DW: 
insert into DW..F Venda 


Select 


ds. [Data], 
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ds. [Nr NF], 

ds. (Id Cliente], 

ds. [Id Funcionario], 

ds. [Id RegiaoVendas], 

ds. [Vlr Imposto], 

ds. [Vlr Frete], 

ds. [LinData], 

ds. [LinOrig] 

from DS..F Venda as ds left join DW..F Venda as dw 
on ds.Data = dw .Data 

and ds.Nr NF = dw.Nr NF 

and ds.Id Cliente dw.Id Cliente 

and ds.Id Funcionario dw. Id Funcionario 
and ds.Id RegiaoVendas = dw.Id RegiaoVendas 
where dw.Data is null 


-- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'I 
mporta Fatos de Venda','S', 'Carga de F VENDA com sucesso.') 


end try 
begin catch 
- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'Impor 
ta Fatos de Venda','F', 'Erro ao carregar F VENDA.') 
end catch 


Algumas observações quanto a este código: 


e Utilizamos variáveis para receber o ID dos dados 
genéricos. Por favor, nada de “chumbar” informação 
variável em código! 

e Como os dados do que seria o cabeçalho da NF se 
repetem para cada item da nota (para cada produto), 
basta colocarmos o comando Distinct no começo do 

Select para trazermos um único registro por nota 
fiscal, que é o que queremos! 


4.10 CARREGANDO A FATO DE DETALHE DE 
VENDA 
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Essa carga é extremamente parecida com a anterior! Basta 
adicionarmos os dados do Produto na nossa seleção, mas 
basicamente teremos o mesmo processo. 


Primeiramente vamos criar a F VendaDetalhe no nosso 
DataStage, também igual à sua contraparte no DW: 


USE [DS] 
Go 


CREATE TABLE [dbo].[F VendaDetalhe]( 
[Data] [date] NOT NULL, 
[Nr NF] [varchar](10) NOT NULL, 
[Id Cliente] [int] NOT NULL, 
[Id Funcionario] [int] NOT NULL, 
[Id RegiaoVendas] [int] NOT NULL, 
[Id Produto] [int] NOT NULL, 
[Vlr Unitario] [decimal](18, 2) NOT NULL, 
[Qtd Vendida] [int] NOT NULL, 
[LinData] [date] NOT NULL, 
[LinOrig] [varchar](50) NOT NULL, 
CONSTRAINT [PK F VendaDetalhe] PRIMARY KEY CLUSTERED 
( 
[Data] ASC, 
[Nr NF] ASC, 
[Id Cliente] ASC, 
[Id Funcionario] ASC, 
[Id RegiaoVendas] ASC, 
[Id Produto] ASC 


Tal qual fizemos anteriormente, nosso processo de carga deverá: 


e Selecionar todos os dados de venda; 

e Atribuir a cada dimensão, sua surrogate, mesmo que 
seja a dos registros genéricos; 

e Avaliar se o dado já existe ou não na Fato do DW, e 
carregar apenas os novos registros; 

e Teremos de colocar a fonte do dado e a data em que ele 
entrou para nossa Base, como recurso de Lineage para 
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cada registro; 

e E, como sempre, se ocorrer um problema, um log de 
erro deve ser inserido. Se não, um log de sucesso deve 
ser inserido. 


Este comando criará um procedimento para a carga da tabela de 
Fato Vendas Detalhe, desde o Data Stage até o Data Warehouse: 


USE [DS] 
Go 


Create Procedure [dbo].[Carrega F VendaDetalhe] 
as 


begin try 
-- Apaga os dados da F VendaDetalhe no Stage: 
truncate table [DS]..[F VendaDetalhe] 


-- Insere os dados na F Vendas no Stage: 
- Determina os "Ids" dos Genéricos: 
declare QGidclienteGenerico int = (Select Id Cliente from D 
W..D Cliente where Cod Cliente = '999999') 
declare QidFuncionarioGenerico int = (Select ID Funcionari 
o from DW..D Funcionario where Login = 'Não Aplica!) 
declare QGidRegiaoGenerico int = (Select Id RegiaoVendas fr 
om DW..D RegiaoVendas where Nome = 'Não Aplica') 
declare GidProdutoGenerico int = (Select Id Produto from D 
W..D Produto where Cod Produto = '999999' and [Ativo] = '1') 


insert into DS..F VendaDetalhe 
Select 
Data, 
Nr NF, 
Id Cliente, 
Id Funcionario, 
Id RegiaoVendas, 
Id Produto, 
sum(Vlr Unitario), 
sum(Qtd Vendida), 
Getdate() as [LinData], 
'Arquivo de Vendas! as [LinOrig] 
from( 
Select Distinct 
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isnull(a.DataVenda, '1900/01/01') as Data, 
isnull (a.NrNf, '000000') as Nr NF, 
isnull(c.Id Cliente, QidclienteGenerico) as Id Cliente 


isnull(d.Id Funcionario, (QidFuncionarioGenerico) as Id 


_Funcionario, 


iaoVendas, 


r Unitario, 
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isnull(e.Id RegiaoVendas, (QidRegiaoGenerico) as Id Reg 
isnull(f.Id Produto, (QidProdutoGenerico) as Id Produto 
isnull(cast(a.PrecoUnitario as decimal(18,2)),0) as V1 


isnull(cast(a.Qtd as int),1) as Qtd Vendida, 
Getdate() as [LinData], 

'Arquivo de Vendas!" as [Lin0Orig] 

from DS..TbImp Vendas as a Left join DW..D Data as b 
on a.DataVenda = b.Data 

left join DW..D Cliente as c 

on a.CodCliente = c.Cod Cliente 

left join DW..D Funcionario as d 

on a.VendedorLogin = d.Login 

left join Dw..D RegiaoVendas as e 

on a.RegiaoVendas = e.Nome 

left join DW..D Produto as f 

on a.Cod Produto = f.Cod Produto 

where f.Ativo = '1' 

) as x 


Group by 

Data, 

Nr NF, 

Id Cliente, 

Id Funcionario, 
Id RegiaoVendas, 
Id Produto 


-- Carrega os dados no DW: 
insert into DW..F VendaDetalhe 
Select 


ds. 
ds. 
ds. 
ds. 
ds. 
ds. 
ds. 
ds. 
ds. 


[Data], 

[Nr NF], 

[Id Cliente], 

[Id Funcionario], 
[Id RegiaoVendas], 
[Id Produto], 

[Vlr Unitario], 
[Qtd Vendida], 
[LinData], 
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ds. [LinOrig] 
from DS..F VendaDetalhe as ds left join DW..F VendaDetalhe 


as dw 
on ds.Data = dw .Data 
and ds.Nr NF = dw.Nr NF 
and ds. Id Cliente = dw.Id Cliente 
and ds. Id Funcionario = dw.Id Funcionario 
and ds.Id RegiaoVendas = dw.Id RegiaoVendas 
and ds. Id Produto = dw.Id Produto 


where dw.Data is null 


-- Faz o log do processo: 
insert into [dbo].[Adm Log] values (newid(), getdate(), 'I 
mporta Fatos de Detalhe de Venda','S', 'Carga de F VENDADETALHE co 
m sucesso. ') 


end try 
begin catch 
-- Faz o log do processo: 

insert into [dbo].[Adm_Log] values (newid(), getdate(), 'Impor 
ta Fatos de Venda Detalhe','F', 'Erro ao carregar F VENDADETALHE. ' 
) 


end catch 

Note a condição where ao final do processo de carga do 
DataStage. Ela garante que os produtos carregados serão somente os 
que possuem a versão ativa. Sem esse comando, haveria duplicidade 
dos registros que já tivessem algum produto inativado pela 2SCD. 
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Criamos todas as procedures que compõe o processo de carga. 
Diariamente, ou na periodicidade desejada (lembre-se da latência 
que comentamos anteriormente), vamos executar esse 
processamento a fim de carregar os arquivos que forem gerados à 
partir dos transacionais. 


Uma forma de facilitar a chamada a cada um dos processos de 
carga é criar uma procedure que vai fazer a execução de todas as 
outras, na ordem certa! 
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O comando seguinte criará a procedure “Workflow” que 
chamará cada uma das cargas na ordem correta. Quando formos 
criar os processos de agendamento, bastará executar essa única 
procedure e todo o processo será chamado: 


USE DS 
GO 


create procedure Workflow 
as 


-- Carrega os dados do arquivo de Vendas: 
exec [dbo].[Importa_Vendas] 


-- Carrega as Dimensões: 

exec [dbo].[Carrega_D_Data] 

exec [dbo].[Carrega_D_Cliente] 
exec [dbo].[Carrega_D_Geografia] 
exec [dbo].[Carrega_D_Funcionario] 
exec [dbo].[Carrega_D_Produto] 


-- Carrega as Fatos: 
exec [dbo].[Carrega_F_Venda] 
exec [dbo].[Carrega_F_VendaDetalhe] 


Se estivéssemos usando a versão paga do SQL Server, teríamos a 
nosso dispor a possibilidade de criar Jobs, que são rotinas 
agendadas. Fles seriam criados para executarem os processos de 
carga na hora correta. Como estamos usando a versão gratuita, não 
temos esse recurso disponível. 


Mas essa falta é facilmente contornada com o uso do 
agendamento do próprio Windows! Com ele, poderemos criar a 
chamada para a execução da nossa procedure Workflow sem 
problemas! Só que, para isso, teremos de seguir alguns passos. 


Primeiramente, vamos criar um usuário no nosso servidor de 
banco de dados que terá permissão para executar esse comando. Por 
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padrão (e fizemos a instalação padrão), o SQL só permite conexão 


de usuários autenticados pelo Windows. Como vamos usar um 


usuário do próprio SQL, precisaremos alterar essa configuração. 


No Management Studio, clique com o botão direito na Instância 


e selecione Propriedades . Na aba Segurança , selecione Modo 


de Autenticação do SQL Server e do Windows , conforme: 


= id id | À Mova Corta Ly d [7 


Pesmunador de Objeto 


Conectar- Se 3/0 TS 
LÓ WIN-207202865MF | BIPRD (SQL Server 12.0.2000 - 
+ (34 Bancos de Dados 
a Da Segurança 
# [28 Objetos de Servidor 
» (29 Replicação 
+ D Gerenciamento 


Conexão 


Senador 

WIN 20 73028GEME GIP RO 

Comendo: 

WIN 20 7IOZEG EM Aderarmtonde 

34 Dios pruaoedades da 
cara 


Progresso 
Prorto 


Modo de Aserticação do Windows 


E Modo da Aderticação do SOL Sarver a do Windows 


Atona de logon 
Peertuma 

w Somente logòs com falha 
Somente logora bem-sucedidos 
Logona com taha e bem sucedidos 


Corta pry da sardor 
Mabitar corta prmey do servidor 


Ouções 


Mabdtar rastreamento de musitora C2 


Encadesemerto de proçeindades de bancos de dados 





Feito isso, o comando a seguir vai criar o usuário com permissão 


para acessar o DS e o DW, e para utilizar os comandos de Bulk 


Insert: 


USE [master] 

GO 

CREATE LOGIN [BI User] 
WITH PASSWORD= 'P@sswOrd', 


DEFAULT LANGUAGE=[Português (Brasil)], 
CHECK EXPIRATION=OFF, CHECK POLICY=OFF 


Go 


master..sp addsrvrolemember Qloginame = N'BI User", @rolename = Nº 


sysadmin' 
GO 
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Para que esse usuário de fato passe a ter acesso, a Instância do 
SQL Server Express deverá ser reiniciada para efetivar o modo de 
autenticação. Clique com o botão direito do mouse novamente na 
instância e selecione Reiniciar , dando OK para a mensagem de 
aviso. 


de IS é | A Nora Consulta Ly tb tb) dis] 9 = 


a 
a 


sena sase 


5, tus | master | * Executar p Depurar S «4 Ro = 














ENT.) wiN-20730286º EaD nd cinta N- 20730283G 
= i Bancos de Da. Conectar... | 
| O Bancos de Desconectar 
= [J Adventure Registrar... 
a] T| DS 
= B DW Nova Consulta 





= |] Reportser Monitor de Atividade 
m |] ReportSer' 
3 Segurança Iniciar 
= Em Objetos de Se Parar 
+ Replicação 











- Pausar 
3 Gerenciament e 
| Continuar | 
| Fen J 
Reiniciar O OOOO 
| 
Políticas b 
Facetas 





Iniciar PowerShell 


Relatórios b 





Atualizar 





Propriedades 


Depois vamos criar um arquivo executável que disparará nossa 
procedure, o chamado arquivo .bat . Nele inseriremos uma linha 
de comando que fará a requisição para o SQL, a fim de executar 
nossa procedure. 
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O SQL Server possui um command prompt chamado sqlcmd 
pelo qual podemos passar as credenciais de usuário (por isso 
criamos o BI User ) e os comandos que serão executados. No 
nosso caso, a procedure Workflow . 


Para tanto, vamos criar uma pasta que conterá nossos bats . 
Podemos criar a c:Ncomandos . Depois, abra um editor de texto 
(Notepad, Notepad++, Aton, qualquer um) e digite o comando: 
sqlcmd -S "WIN-2073028G8MFNBIPRD" -U "BI User" -P "POssword" -Q "E 
xec DS. .workflow" 

Detalhando o comando, temos que -S é o Servidor e instância 
(para obter corretamente essa informação, digite o comando 

select (QOSERVERNAME no Management Studio), -U” é o 
comando para passar o usuário, -P passará a senhae -Q passará a 
query propriamente dita para o SQL. 


Salve o arquivo com o nome CargaDiaria.bat dentro da 
pasta que criamos e pronto! Temos nosso comando finalizado: 


di Uia =| Comandos 


EM Início Compartilhar Exibir 


e “am [dé » Meu computador » Disco Local (C:) » Comandos 








À saio Nome Data de modificaç.. Tipo Tama 


EE Área de Trabalho E] CargaDiaria 


Arquivo Editar Formatar Exibir Ajuda 
sglcmd -S "WIN-2073028G8MFYBIPRD” -U "BI User" -P "PásswBrd” -Q "Exec DS. workflow" 








Para o agendamento propriamente dito, precisaremos entrar nas 


Ferramentas Administrativas do Windows e abrir Agendador 
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de Tarefas: 





Início Compartilhar Exibir Gerenciar 
































Mm « Sistema e Segurança » Ferramentas Administrativas yv 6 Pesquisar 
x aana Nome - Data de modificaç... Tipo 1 
EE Área de Trabalho aÈ Terminal Services 22/08/2013 12:39 Pasta de arquivos 

b Downloads D Agendador de Tarefas 22/08/2013 03:55 Atalho 
T Locais recentes (Bb Assistente de Configuração de Segurança 22/08/2013 03:45 Atalho 
ep Backup do Windows Server 22/08/2013 03:53 Atalho 
j Meu computador [E] Configuração do Sistema 22/08/2013 03:53 Atalho 
| Área de Trabalho [ah Desfragmentar e Otimizar Unidades 22/08/2013 03:47 Atalho 
B Documentos [Æ] Diagnóstico de Memória do Windows 22/08/2013 03:52 Atalho 
i Downloads P Firewall do Windows com Segurança Ava... 22/08/2013 03:45 Atalho 
È Imagens Fontes de Dados ODBC (32 bits) Atalho 
T Músicas [EM Fontes de Dados ODBC (64 bits) Atalho 
E Vídeos Ē Gerenciador de Servidores 55 Atalho 
ês Disco Local (C:) [89 Gerenciamento do computador :5 Atalho 
a Informações do sistema :5 Atalho 
Ei Rede [EE Iniciador iSCSI Atalho 
(5) Monitor de Desempenho Atalho 
é) Monitor de Recursos Atalho 
[Za Política de Segurança Local 22/08/2013 Atalho 
(8)* Serviços de Componentes 22/08/2013 03:57 Atalho 
(al: Serviços 22/08/2013 03:54 Atalho 
al! Visualizador de Eventos 22/08/2013 03:55 Atalho 
Windows PowerShell (x86) 22/08/2013 12:37 Atalho 


Abrindo o Agendador, clique em Biblioteca do Agendador 
e, ao lado direito, Nova Pasta . Nomeie a pasta como BI : 
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Status Disprcadores Horário da Preuimria Execução Horário 4 | Ações 
B Optimee Sta... Desabütado Quando o computador estiver eciosa exosv2d 


T) Crims Tarela Basica 

me Cra Tareta. 
Importar Tarefa 

Cm Dabir Todas as Taretas em Execução 

Je] Hatahitar o Histónco de Todas as T.. 

| 
Eta + 

D Atuahcm 


[|E Haina 


Exportar. 
b Propeiedades 
K Eus 
E anus 








Opções de segurança 
Ao executa à tireta, usar a seguinte conta de usuário: 
dadrunuctrados 
Esrerdas somente quando o ususno estve conectado 
Executar estando o usuário conectado ou não 
t w > 











Clique na pasta BI recém-criada, e clique em Criar Tarefa 


Básica: 





o) 


 Arquno Ação Enb Ajuda 


+ ar um 


CD Agendador de Tarefas Local Status Disparadores Horário da Próxma Execução Horário ds Ultima Execução Resultado 
4 TĒ Biblioteca do Agendador 
D Microsoft 





Toreta. 

K| Criar uma Tarefa Básica Todas as Tarefas em Execução 
tar o Historico de Todas as To 
Paas 


onbgurag, como ações ou dnparadores de vanas tarefas, use o comando Cras |r Pasto 
Tarela do panel Ações. E | 
Nome: [Carga 


EEEE Use este assistente para agendar rapidamente uma tarefa comum. Para obter mas opções ou 
Disparador o es avançadas, 





Descrição: | Processo de carga diária do Bi.| 











Podemos dar o nome de CargaD1 , porque esse agendamento 
será responsável por executar as cargas que ocorrerão uma vez ao 
dia. Quando novos arquivos forem sendo disponibilizados, bastará 
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adicionar seus processos na procedure Workflow, sem necessidade 
de dar nenhuma manutenção nesse agendamento. Se precisarmos 
de cargas com latências diferentes, aí sim criaremos novos 
agendamentos com o nome referenciando a periodicidade, como 
CargaH12 ou CargaM1 (para dados carregados mensalmente), 
por exemplo. 


Clicando em Avançar , selecione o agendamento 
Semanalmente e vamos atribuir que esse procedimento ocorrerá às 
6:00hs somente nos dias úteis. A periodicidade deverá atender ao 
seu negócio. Se a origem dos dados (no nosso exemplo, o arquivo 
MassaDados.rpt ) for gerado todo dia, inclusive aos finais de 
semana, opte pela periodicidade Diariamente . 


Mas para efeito do nosso cenário, vamos prosseguir com o 
agendamento nos dias úteis e, para tanto, configure selecionando os 
dias de segunda a sexta-feira: 


Agendador de Tarefas l-lal x J 
Arquivo “Ação Eiir Ajuda 
e + Am Bim 
5) Agendador de Tarefas (Local E home Status Despacadores Horário da Próxima Execução Horina da Lama Execução Resultado | Ações 
a R Biblioteca do Agendador a 
p T Microseft es re acc tino 
Ta aid 








areta. 
ta Tarela. 
3| Semanalmente Todas as Tarefas em Execução 


tàr o Histórico de Todas as Tuu 


Criar uma Tarefa Básico TER 
jee 3005/2016 De | DEGO0O 5 Sanc ronugas fusos horinos 
Dispacador 


Repetir acads: [1 | vemanaseme 
domingo (segunda ii terça MM quyta 


È quinta 2 sexto) —) sábado 


m < Voter Apençr> 


Avançando, teremos as opções de Iniciar um Programa , 


Enviar um Email ou Exibir uma Mensagem . Opte por 
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Iniciar um programa e clique em avançar . Na seleção 
Procurar... ,selecioneo .bat que fizemos: 


| Iniciar um Programa 


Criar uma Tarefa Básica 


Disparador Programaiscript 





Semanalmente 








CiComandosiCargaDiaria.bat 








Ação 





niciar um Programa Adicione argumentos (opcional): 














Concluir Iniciar em (opcional): 




















< Voltar Avançar > Cancelar | 








Feito isso, basta avançar e concluir! Nosso agendamento estará 
pronto para ocorrer todos os dias úteis, ás 6:00hs. 


4.12 REVISÃO E TESTES 


Para testarmos o processo todo, vamos criar mais um arquivo de 
dados. Se nos lembrarmos do capítulo do desenho de nosso DW, 
havíamos feito um script para a geração da massa de testes e 
colocado nele o filtro para obtermos apenas os dados de um 
determinado ano. Recuperando o referido script, altere a condição 

where para o ano de 2006 e repita o processo de geração do 
arquivo: 


where year([OrderDate]) = 2006 


Teremos então, novamente, um arquivo chamado 
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MassaDados.rpt no diretório c:Narquivos . 


Feito isso, vá até a pasta c:Ncomandos onde deixamos nosso 
arquivo .dat que será executado todo dia às 6:00hs. Vamos, para 
efeito de testes, executá-lo manualmente. Clique duas vezes nele. 
Um prompt será exibido com o comando que havíamos declarado: 
Início Compartilhar Exibir Gerenciar 


€) ~ | db + Meu computador > Disco Local (C;) » Comandos 


Nome Data de moi 





= 
=n — A Min Lotes. 1KB 


EC:NComandos>sglemd -S “WIN-2073028G8MPNBIPRD" -U “BI User" -P “PEsswðrd” -Q * 
k DS. .workf lou" 


» Perflogs 
J Program Files (x86 
J Usuários 


BE tarda 


Assim que o processo terminar, o prompt fechará 
automaticamente. Nesse momento, teremos de ter o arquivo na 
pasta c:NarquivosNHistorico com a data de hoje e os dados 
carregados no BI! Execute o comando select count(*) from 
F VendaDetalhe . Teremos passado de 5.149 registros (da primeira 
carga) para 24.496. 


Finalmente, execute a geração de um arquivo com todos os 
dados disponíveis (apenas excluindo a cláusula where do comando 
de extração). Será um arquivo com 121.319 linhas (sendo os dois 
primeiros do cabeçalho). Não haverá problemas dos dados dos anos 
2005 e 2006 estarem na massa. Nosso processo de carga é 
incremental, então os registros já carregados não serão duplicados. 
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Deixe o arquivo na pasta c:Narquivos e espere até a manhã do 
próximo dia útil! O processo deve ter sido carregado, inclusive com 
os Logs de sucesso (ou falha!) na tabela Adm Log : 





Data Passo Sucs 

“| 2016-0601 06:00:01.613 Importa MassaDados-pt s Arquivo importado com sucesso 

| 2016-06-01 06:00:01.997 Importa Data s Carga de D_Data com sucesso. 

6DE70362-9110-42BA-B108-07895B7C9A39 2016-06-01 06:00:03.217 Importa Cliente s Carga de D_Cliente com sucesso 
s 

s 

s 

s 

s 





essoFaha mensagem 





55C9C642-3B28-4261-86F7-CB5058213D75 2016-06-01 06:00:03.797 | Importa Geografia 
BESD9ATE-SADF-40DS-A1A7-D2D7CID4C6OD 2016-06-01 06:00:04.767 Importa Funcionano 
CACOC8B9-1B64-4596-8DFF-9DCFAC84D570 2016-06-01 06:00:05.890 Importa Produto 
636F10B4-E0D1-403C-B41B-DEAB74A5F2D7 2016-06-01 06:00:07.113 Importa Fatos de Venda 
EFB94EE2-DBF8-4DAE-B4A3-07993D12E254 2016-06-01 06:00:09.523 Importa Fatos de Detalhe de Venda 


Carga das tabelas de Geografia com sucesso 
Carga de D, Funcionario com sucesso. 

Carga de D. Produto com sucesso. 

Carga de F. VENDA com sucesso 

Carga de F. VENDADETALHE com sucesso 


4.13 CONCLUSÃO 


Fizemos neste capítulo todo o processo de carga e agendamento 
dos dados de um arquivo texto para nosso DS, e posteriormente 
para nosso Data Warehouse. Criamos soluções para tratamento de 
erros e para dados nulos! 


Nosso ETL está pronto para carregar dados todos os dias, 
alimentar nosso DW e possibilitar que consultemos as informações 
das mais variadas formas a fim de, finalmente, começarmos a 
analisar nossos fenômenos. 
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CarítuLo 5 


EXPONDO AS 
INFORMAÇÕES 


5.1 OPÇÕES DE CONSUMO DO BUSINESS 
INTELLIGENCE 


Como vimos na descrição da plataforma de BI, existem diversas 
opções para consumirmos as informações existentes no nosso DW 
e, com o advento de novas tecnologias e de novas formas de análise, 
a tendência é que essas opções aumentem cada vez mais. O que 
temos de ter em mente é com qual forma de exibição atenderemos 
às necessidades de nossos usuários. 


Se formos entregar as ferramentas que atendem aos níveis 
pessoais de Business Intelligence para os consumidores dos níveis 
corporativos (ou vice-versa), teremos um grande fracasso. Vale 
lembrar de que temos três tipos de consumo de BI: 


e Corporativo: são as visões mais aglutinadas, os KPIs e 
cockpits de dados agrupados. Geralmente, são os 
diretores e gestores que consomem essas informações. 

e Departamental: são os relatórios detalhados e as visões 
com pesquisas. São utilizadas pelos coordenadores e 
analistas que operam o dia a dia. 

e Pessoal: são as planilhas dinâmicas que geram análises 
precisas de dados. São usados pelos especialistas 
(independente da hierarquia) que buscam novas 
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análises, novos fenômenos e relações. 


O que cobriremos neste capítulo é a criação de soluções para 
cada tipo de consumo, nos atendo aos exemplos relativos aos dados 
de notas fiscais que importamos e às possibilidades com as 
ferramentas que escolhemos. Pela própria natureza de uma 
plataforma de BI, temos infinitas formas de apresentar e interpretar 
as informações, por isso mesmo o que pretendemos aqui é 
exemplificar o que se pode fazer e não gerar um guia sobre quais 
indicadores deveriam ser criados para uma análise de varejo. 


Assim sendo, vamos criar um dashboard para nosso nível 
corporativo e um relatório detalhado para nosso nível 
departamental. Para o nível pessoal, criaremos uma visualização por 
meio de uma tabela dinâmica. 


5.2 OBTENDO AS FERRAMENTAS E ADD-IN 


Usaremos duas ferramentas para atendermos às demandas de 
uso da nossa plataforma de BI: o Reporting Service para atender às 
dashboards e aos relatórios, e o Excel com o SQL Server PowerPivot 
para atender às consultas dinâmicas e mesmo às dashboards. 


O Reporting Service é de fato gratuito e foi instalado juntamente 
com o SQL Server. Ele é um servidor de relatórios (server side). Para 
criarmos os relatórios que ficarão disponíveis nele, precisaremos 
instalar uma ferramenta chamada SSDT (SQL Server Data Tools) 
que atualmente é componente do Visual Studio. Veremos a seguir 
como baixar e configurar tudo! 


O Excel é um componente do Office e rodará nas estações dos 
usuários (client side). É certo que ele é um produto pago, mas 
entendo que já está presente e disponível em seu ambiente, e por 
isso o consideramos como parte integrante da solução gratuita. O 
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detalhe é para o Add-in PowerPivot que deve ser instalado ou 
habilitado em cada máquina cliente, como veremos logo a seguir. 


Não vou entrar no mérito do uso de, por exemplo, o OpenOffice 
versus as ferramentas da Microsoft, porque não quero criar 
inimizades por aqui. Mas caso você não possua o Excel nas 
máquinas de seus usuários, avalie a possibilidade (estou apenas 
convidando, ok?) de adquirir uma assinatura do Office 365 
(http://www .office365.com). 


Para a criação dos relatórios que serão publicados no Reporting 
Service, precisaremos do SSDT. Nas versões anteriores, essa 
ferramenta já vinha integrada ao pacote de Ferramentas 
Administrativas da instalação do SQL Server, tal qual o 
Management Studio e o Profiler. Desde as últimas versões, contudo, 
a Microsoft decidiu por disponibilizá-la como um pacote à parte 
integrado ao Visual Studio. 


O correto é instalar as ferramentas de desenvolvimento em 
outra máquina que não o servidor. Um PC com Windows 7 ou 
superior é o ideal. Cria-se os relatórios nas estações dos 
desenvolvedores para depois efetuar o upload para o servidor. 


Primeiramente, temos de fazer o download dessa ferramenta 
que pode ser feito pelo link https://www.microsoft.com/pt- 
br/download/confirmation.aspxºid=42313. Depois de feito o 
download, clique duas vezes no arquivo SSDTBI x86 PTB.exe 
(baixei a versão em português). Selecione um local para a extração 
dos arquivos, e aguarde a extração e execução automática do 
instalador: 
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Termos de Licença 


Para instalar o SQL Server 2014, você deve aceitar os Termos de Licença para Software Microsoft. 


Termos de Licença 

Regras Globais 

Microsoft Update 
Atualizações de Produto 
Instalar Arquivos de Instalação 
Instalar Regras 

Tipo de Instalação 

Seleção de Recursos 


Regras de Recurso 


Regras de Configuração de Rec... 


Andamento da Instalação 


Concluída 





TERMOS DE LICENÇA PARA SOFTWARE MICROSOFT 


MICROSOFT SQL SERVER DATA TOOLS - BUSINESS 
INTELLIGENCE FOR VISUAL STUDIO 2013 
Os presentes termos de licença constituem um acordo entre a Microsoft Corporation 


(ou, dependendo do local no qual você esteja domiciliado, uma de suas afiliadas) e 
você. É importante lê-los. Eles se aplicam ao software acima identificado, que inclui, ~v 


sa 
Copiar Imprimir 





Aceito os termos da licença. 





Ative o Programa de Aperfeiçoamento da Experiência do Usuário e o Relatório de Erros para ajudar a 











melhorar a qualidade, a confiabilidade e o desempenho de softwares e serviços do Microsoft SOL 





Server 2014. 





Consulte a Política de Privacidade do Microsoft SQL Server 2014 para obter mais informações. 


* O Microsoft SQL Server 2014 também inclui um componente do Visual Studio que terá as 
configurações de Programa de Aperfeiçoamento da Experiência do Usuário desativadas por padrão. Se o 
Visual Studio for instalado, esse componente usará as configurações de Programa de Aperfeiçoamento 
da Experiência do Usuário para Visual Studio. 








< Voltar Avançar > Cancelar 




















Aceite os termos de licença e clique em Avançar . Opte por 


usar o Microsoft Update e avance novamente. Opte por executar 


uma nova Instalação do SQL Server. Se optar por adicionar à 


instância existente, a instalação apresentará um erro. 
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Tipo de Instalação 


Execute uma nova instalação ou adicione recursos a uma instância existente do SQL Server 2014. 


Termos de Licença 

Regras Globais 

Microsoft Update 
Atualizações de Produto 
Instalar Arquivos de Instalação 
Instalar Regras 

Tipo de Instalação 

Seleção de Recursos 


Regras de Recurso 


Regras de Configuração de Rec... 


Andamento da Instalação 
Concluída 


Selecione a opção do SQL Server Data Tools e clique em 


Avançar 
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(9) Executar uma nova instalação do SQL Server 2014 


Selecione esta opção se desejar instalar uma nova instância do SQL Server ou instalar componentes 
compartilhados, como o SQL Server Management Studio ou Integration Services. 


(O Adicionar recursos a uma instância existente do SQL Server 2014 





|BIPRD | 

Selecione esta opção se desejar adicionar recursos a uma instância existente do SQL Server. Por 
exemplo, para adicionar os recursos do Analysis Services à instância que contém o Mecanismo de 
Banco de Dados. Os recursos em uma instância devem ser da mesma edição. 


Instâncias instaladas: 





Nome da 
Instância — 
BIPRD | 


ID da Instância Recursos Edição Versão 


— Imssani [12020008 








[MSSQL12.BIPRD, M... |SQLEngine SQLEn... | Express 
| 


<Componentes Co... [12.0.2000.8 


|ssMs, Adv SSMS, ... | 











< Voltar || Avançar > Cancelar 
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Seleção de Recursos 


Selecione os recursos Express a serem instalados. 





Termos de Licença | Recursos: Descrição do recurso: 


Te Recursos da Instância Instala projetos do SQL Server 
Microsoft Update Recursos Compartilhados Business Intelligence para Analysis 
Atualizações de Produto [7] SQL Server Data Tools - Business Intelligence para Visual S| | Services, Integration Services e 


è = *| SDK de Conectividade de Cliente SOL 
Instalar Arquivos de Instalação isitos 
o E Recursos Redistribuíveis Peas Euo 


Instalar Regras selecionados: 


Tipo de Instalação Já instalado: Eq 
Seleção de Recursos Pacotes Redistribuíveis do Microsc 





























Regras de Recurso <| m | > 











Regras de Configuração de Rec... Requisitos de Espaço em Disco 





Andamento da Instalação > r 
Unidade C: 1629 MB necessários, 


Concluída 75279 MB disponíveis 
<] m 



































Selecionar Tudo || Anular Todas as Seleções 














Diretório raiz da instância: [CaProgram Files (126) Microsoft SQL Server | | 








Diretório de recursos compartilhados: | CNProgram Files\Microsoft SQL Server 


Diretório de recursos compartilhados (x86): [ENProgram Files (86) Microsoft SQL Server 





< Voltar Cancelar 
































Se tudo correu bem, a mensagem de êxito deve ser exibida ao 
final do processo: 
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Concluída 


Instalação do SQL Server 2014 concluída com êxito com atualizações de produto. 


Wermos ie Licença Informações sobre a operação de Instalação ou as próximas etapas possíveis: 
Regras Globais 
Microsoft Update 


Atualizações de Produto 





Recurso Status 


Intelligence para... Ext 


Instalar Arquivos de Instalação 
Instalar Regras 

Tipo de Instalação 

Seleção de Recursos 

Regras de Recurso 


Regras de Configuração de Rec... Detalhes: 





Andamento da instalação Exibindo a documentação do produto do SQL Server 
Concluída 


Somente os componentes que você usa para exibir e gerenciar a documentação do SQL Server 
foram instalados. Por padrão, o componente Visualizador da Ajuda usa a biblioteca online. 
Depois de instalar o SQL Server, você pode usar o componente Gerenciador da Biblioteca de 
Ajuda para baixar a documentação para o computador local. Para obter mais informações, 
consulte Usar Microsoft Books Online para SQL Server (<http://go microsoft com/fwlink/? 


LinliN-9006 721 





O arquivo de log de resumo foi salvo no seguinte local: 


“Program Files (x86)NMicrosoft SQL Server 2! Bootstrapl 0160815 1648201Summary WIN- 
2073028C8MF 20160815 16482054 


























Em Programas , o Visual Studio 2013 poderá ser localizado. Ao 
ser iniciado, selecione Novo Projeto e note que abrirá a tela de 
opções de criação de projetos do Analysis Services, do Integration 
Services e do Reporting Services. Vamos iniciar um novo projeto de 
servidor de relatório. Podemos nomeá-lo de BI e deixar os 
arquivos no local padrão. Depois, basta clicar em OK : 
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b Recentes NET Framework 45 ~| Classificar por: [Padrão 38º [=| | Pesquisar Modelos instalados (Ctri+E) P ~ 


4 instalado 
E? Projeto Multidimensional e de Mineração de Dad... Business Intelligence Tipo: Business Intelligence 


4 Modelos Criar um projeto vazio do Servidor de 
Relatório. 


-BERE Projeto do Integration Services Business Intelligence 


Analysis Services 7 
Assistente de Projeto do Servidor de Relatório Business Intelligence 
Integration Services 
Reporting Services Bd] Projeto do Servidor de Relatório Business Intelligence 
b Outros tipos de projetos 


Emas Projeto de Tabela do Analysis Services Business Intelligence 


b Online 


Clique aqui para ficar online e localizar modelos. 











Nome: Bl 

















Local: ciuserstadministradoridocumentsivisual studio 2013Projects Procurar... 

















Nome da Solução: BI Criar diretório para solução 








OK Cancelar 

















Conforme formos criando os relatórios e dashboards, 
comentaremos sobre os conceitos de uso do Visual Studio. Por hora, 
termos chegado até aqui indica que tudo está em ordem! 


Feita a instalação do SSDT, vamos instalar ou habilitar o 
PowerPivot, que será usado nas estações dos usuários do BI. Esse 
add-in permitirá dar muito mais poder às consultas dinâmicas do 
Excel! 


Para obter o PowerPivot para o Excel 2013 em diante, basta 
habilitá-lo. No Excel, vá em Arquivo , depoisem opções e depois 
em Suplementos . Na parte debaixo da janela, selecione 

Suplementos com e clique em ir . Selecione o PowerPivot e 
cliqueem OK : 
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k » [mp E 

£ -= - 

ADi va 5755 ESMecdar è Contains = W. Mo 4345 Formatação Formatar como Estilos de in 
a Condicional - Tabela Célula = 





AL fs 





M Eaz 
2 
$ o Offic Remise Support ter Ext SSB | 
A fo Ex 
s E erani Par Faer o Pa  T———e 
5 M - tficerar 
eum Fo 
s Semorer 
T 
; locat Program Fies KSENA Tosoh Office Root Office O ADONS Poser bivo Lecel Add-im PomesPivottace 
o Comportmtado do caeetgumenas: Carregar oo inicializar 





O Menu PowerPivot deve ter aparecido no seu Excel: 












































Dados Revisão Exibir OFFICE REMOTE Team  PowerPivot \ Diga-me o qu 
= F pman) a 
EF Quebrar Texto Automaticamente Geral $ 4 “AM emu EX 
£ -Ø ro 1 ES 
:5= [E|Mesdar e Centralizar ~ E. 9% 000 0 29 Formatação Formatar como Estilos de Inserir Excluir | 











Havendo algum problema, para maiores auxílios, entre no site 
https://support.office.com/pt-br/article/Iniciar-o-suplemento-do- 
Power-Pivot-no-Microsoft-Excel-a891a66d-36€3-43fc-81e8- 
fc4798139ea8?omkt=pt-BR&ui=pt-BR&rs=pt-BR&ad=BR. 


Para o Excel 2010 ou 2007, deve-se efetuar o Download do Add- 
in, em https://www.microsoft.com/pt-BR/download/details.aspx? 
id=29074. Opte pela versão de 32 ou 64 bits (deve ser a mesma do 
Office instalado na máquina de quem vai utilizar a ferramenta): 
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Escolha o download desejado 


























Nome do arquivo Tamanho 
L] 10461ReadMe PowerPivot.htm 12 KB 
v | 1046\x64\PowerPivot_for_Excel_amd64.msi 129.9 MB 
1046\x86\PowerPivot_for_Excel_x86.msi 98.5 MB 





Vale lembrar de que o .Net Framework 4.0 ou superior é pré- 
requisito e deve estar também instalado em cada uma das máquinas 
dos usuários que farão uso do PowerPivot. Ele pode ser baixado 
(versão em português brasileiro) em https://www.microsoft.com/pt- 
br/download/details.aspx?id=30653. 


Uma vez que todos os pré-requisitos tenham sido verificados e 
que se tenha o arquivo de instalação, basta executá-lo nas máquinas 
dos usuários. Clique duas vezes para executar o instalador, aceite os 
termos do contrato e clique em Instalar : 





Concluindo a instalação do Microsoft SQL Server 
2012 PowerPivot para Excel 


A instalação instalou o Microsoft SQL Server 2012 PowerPivot para 
Excel com êxito. Clique em Concluir para sair. 


toltar Conduir Cancelar 
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Feita a instalação, abra o Excel e nova aba deve estar visível. 
Caso contrário, podemos seguir os mesmos passos para habilitar a 
PowerPivot que fizemos para as versões mais novas. Fazendo isso, 
o menu aparecerá no seu Excel 2010: 


Pastal - Microsoft Excel 


Inserir Layout da Pagina Formulas Dados Revisão Exibição Load Test Team 





Geral d E Formatação Condicional Gta Inserir 7 ba 


À EB - % 000 Hi Formatar como Tabela 7 g” Excluir 7 T- 
35 - X Pa v a X = ” til 
2 — A F so 5 E5} Estilos de Célula 7 HE] Formatar | 27 


Mito CA AS 





EE UU 


Fonte Alinhamento Número á Estilo Células 


Quando formos criar nossas visões dinâmicas, explicarei um 
pouco sobre a PowerPivot. Novamente, se a aba do Excel está 
disponível, estamos com tudo certo! 


5.3 CRIAÇÃO E PUBLICAÇÃO DO 
DASHBOARD 


Vamos então desenvolver nosso dashboard que será 
disponibilizado para nossos consumidores do BI Corporativo. A 
ideia é a de criarmos alguns gráficos e indicadores que terão sentido 
entre si, dando aos nossos usuários um panorama geral de como as 
vendas estão indo. Como exemplo, vamos apresentar Receita 
Mensal, Análise de Volume e Participação por Produto e Análise 
de Volume e Participação por Cliente em uma mesma 
visualização. 


Para tanto, vamos abrir novamente o Visual Studio e entrar na 
solução BI que havíamos criado. Ao lado direito, existe o 
Gerenciador da Solução (ou Solution Explorer ) que é a 
árvore do que temos desenvolvido na solução que estamos criando. 
No caso do projeto de relatórios que estamos fazendo, existem 3 
itens: fontes de dados compartilhadas, conjunto de dados 
compartilhados e relatórios. 
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Clique com o botão direito em Fonte de Dados 
compartilhadas e clique em Adicionar Nova Fonte de 
Dados... . Na janela que aparecerá, nomeie a fonte de dados como 
Datawarehouse (dado que é lá que vamos nos conectar) e em 
Cadeia de Conexão , clique em Editar . A nova janela solicitará 
o servidor, usuário, senha e qual o banco de dados. Preencha as 
informações com os dados de acesso ao nosso DW e clique em OK . 
Se estiver tudo certo, o resultado deverá ser: 


Altere o nome, o tipo e as opções de conexão. 


Credenciais 


Nome: 





DataWarehouse 





Tipo: 
Microsoft SQL Server v | 








Cadeia de conexão: 


Data Source=WIN-2073028G8MPWBIPRD; Initial Catalog=DW 
































Ajuda OK Cancelar 

















Se tiver dificuldade para lembrar do nome do servidor, basta ir 
ao Management Studio do SQL Server, abrir uma nova consulta e 
digitar select @@SERVERNAME . O resultado será o servidor a qual 
devemos conectar. O usuário e a senha são os mesmos que criamos 
para o acesso da nossa rotina diáriaem .bat , no capítulo anterior. 
Clicando em ok, a janela será fechada e a fonte de dados 
DatawWarehouse.rds deverá ter aparecido. 


Feito isso, temos agora uma fonte de dados ligada ao nosso DW 
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que poderá ser usada por todos os relatórios que desenvolveremos. 
Vamos então clicar com o botão direito em Relatórios e 
selecionar Adicionar => Novo Item (ou apenas o atalho Crtl+ 
Shift+a ). Na janela que aparecerá, selecione Relatório e nomeie 
de Dashboardvendas.rdl : 


4 Instalado Classificar por: [Padrão = | FE ES Pesquisar Modelos instalados (Ctrl=E) P ~ 


n e m - 
Pitate Eeun MR] Assistente de Relatório Projeto de Relatório Tipo: Projeto de Relatório 


Criar um novo relatório em branco. 
b Online 


fai Fonte de Dados Projeto de Relatório 


Conjunto de Dados Projeto de Relatório 


Clique aqui para ficar online e localizar modelos. 


DashboardVendas.rdl 

















Adicionar Cancelar 








Uma nova configuração de tela do Visual Studio aparecerá, com 
as ferramentas para o desenvolvimento de relatórios. Vamos 
discorrer um pouco sobre essa interface com a qual conviveremos 
bastante durante a vida de nosso BI (novos relatórios serão sempre 
solicitados!). 
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Dashtsoardvendas S [Cras] = x 





h com do plats de fundo do tam 








À direita, temos o já mencionado Gerenciador de Soluções 
que exibirá tudo o que está sendo construído. Por ele que criaremos 
novos itens (como acabamos de fazer), clicaremos duas vezes em 
itens existentes para editá-los etc. 


Logo abaixo dele, temos as Propriedades . Essa janela se 
modifica de acordo com o objeto que está selecionado, mostrando 
sempre as propriedades desse objeto. 


À esquerda, temos a Caixa de Ferramentas que contém os 
componentes que podemos incluir em nosso relatório. Interessante 
mencionar que podemos instalar ferramentas novas (compradas ou 
gratuitas) caso necessário. Se notar bem abaixo, temos uma outra 
aba que é a Dados do Relatório , que fica alternada à Caixa de 
Ferramentas . Usaremos bastante essa aba para definir nosso 
conjunto de dados do relatório e seus respectivos campos! 


Já ao centro, temos o Canvas , que é o nosso relatório 
propriamente dito. Ele se apresenta inicialmente no modo de 
edição. Mas se clicarmos em Exibir , teremos a execução dele tal 
qual o nosso usuário final terá. Vamos usar bastante esse recurso 
durante o desenvolvimento. 


Primeiramente, vamos cuidar de deixar nosso dashboard 
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bonito! Vou colocar um cabeçalho com logotipo e um título e um 
rodapé com a data/hora. Para tanto, clique com o botão direito 
sobre o canvas e clique em inserir . As duas últimas opções são 
Cabeçalho e Rodapé. Insira os dois: 


Dashboardvendas rar t 
J] Bibir 














Paraadicionarumitem a: Colar ramentas para a superficie de designe arraste os campos 
ini e A 


Caixa de Texto 
Linha 

Tabela 

Matriz 








Inserir » 





Exibir » 


Selecionar Tudo 








Propriedades do Corpo... Retângulo 





Lista 
Imagem 


Sub-relatório 


EBLEUDEHZE 


Gráfico 
| T] Medidor 


@ Mapa 


E Grupos de Linhas ii $ Barra de Dados 





Minigráfico 
4 | Indicador 
E] Cabeçalho da Página 
=] Rodapé da Página 








Clique com o botão direito no cabeçalho e clique novamente em 
Inserir . Escolha Imagem e busque pelo logotipo de sua empresa 
(que chamei de Empresa para nosso exemplo). Depois, na caixa de 
ferramentas, arraste uma Caixa de Texto para o cabeçalho e 
escreva nela o Título Dashboard de Vendas . Ajuste a fonte 
(tamanho, cor etc.) pelos botões do ribbon, ou pela caixa 


Propriedades. 


Para a data/hora do rodapé, usaremos uma fórmula! Arraste 
uma Caixa de Texto para o rodapé. Clique com o botão direito 
dentro da caixa e selecione Expressão . Na caixa que abrirá, na 
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parte esquerda, existe um grupo de funções chamado Funções 
Comuns . Expanda e localize Data e Hora . Na caixa do centro, 
selecione Now , clicando duas vezes nela. Na caixa superior, temos 
de ter a expressão =Now() . Clique em OK. 


Definir expressão para: Value 


=Now()] 








100% ~] 
Categoria: Item: 
Campos Internos | [CDate Descrição 
Parâmetros | DateAdd 
Campos DateDiff 
> DatePart 
Conjuntos de Dados DateSerial 
Variáveis DateString 
+- Operadores DateValue 
=- Funções Comuns Day 
Teito FormatDateTime 
Hour 











Retorna um valor Date contendo a 
data e a hora atuais de acordo com o 
seu sistema, 


Natas Bora Minute Exemplo 
Matemática Month 


Inspeção MonthName =NowQ : 

Nena ="Este horário amanhã é" & DateAdd 
Fluxo do Programa Jo sa% 
Second | ( = «1,Now0) são 
TimeOfDay | = Este horário amanhã é" & DateAdd 
(Datelnterval.Day,1,Now()) 


Agregação 


Financeiro F 
Timer 


Conversão | TimeSerial 
Diversos | | TimeString 
TimeValue 























Ajuda Cancelar 


























Cuide para centralizar os textos, colocar as caixas de texto nos 
lugares esteticamente apropriados (conforme os padrões de sua 
empresa, ou gosto dos seus usuários), usar a linha (da caixa de 
ferramenta) para separar as áreas etc. Se clicar em Exibir , 
poderemos ver nosso relatório com cabeçalho e rodapé, mas sem 
nenhuma informação ainda: 
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DaitivordVendacrdt Cr = x 


S co» EMO 





PATUA ws ° 


EMPRESA DASHBOARD DE VENDAS 


01/06/2016 14-14-05 


Feitas as firulas, vamos ao desenvolvimento! Antes de iniciar 
uma codificação, recomendo que se faça um desenho do que será o 
produto final, até para que seus usuários possam validar. Para esse 
primeiro gráfico, que é o de Receita Mensal, o esboço seria algo mais 
ou menos assim: 


PetsiTta Mev SAL. 
(Too 





Ki Lln verre Avo ÉassaPo 
po ULA Vzvos 

# 
Mh imeni D mensal 












f meses 


Será um gráfico de barras com o eixo X determinando os 
últimos seis meses, e o eixo Y será o de valor. Para cada mês, 
teremos duas barras: a do mês do ano atual, e a do mesmo período 
para o ano anterior (para comparação). Teremos também uma linha 
com a média para determinar uma visão da tendência. 


A primeira coisa a ser desenvolvida deverá ser uma consulta no 
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SQL que traga as informações que precisamos: 


Declare @DataAtual Date = (Select max(data) from D Data) 
Declare (QDataAnterior Date = (Select dateadd(year, -1, QDataAtual)) 


Select 

Month(Data) as Mes, 

Sum(Vlr UNitario * Qtd vendida) as VlrAtual, 

O as VlrAnterior 

from F VendaDetalhe as a 

where a.Data between dateadd(month, -5, QDataAtual) and QDataAtual 
group by Month(Data) 

union all 

Select 

Month(Data) as Mes, 

© as VlrAtual, 

Sum(Vlr UNitario * Qtd vendida) as VlrAnterior 

from F VendaDetalhe as a 

where a.Data between dateadd(month, -5, ODataAnterior) and QDataAnte 
rior 

group by Month(Data) 


Alguns pontos sobre esse comando: 


e Não usamos a data de referência como “hoje” e sim 
como a última data carregada no DW. Usualmente 
deverá corresponder à mesma coisa, mas essa prática 
evita termos colunas zeradas em viradas de ano ou de 
mês, se por acaso passarem alguns dias sem vendas. 

e Note que esse comando não “junta” os dados de venda 
atual com venda do mês passado na mesma linha. Essa 
junção será feita pelo componente de gráfico do 
relatório. Se fossemos resolver pelo SQL, teríamos um 

sub-select ea performance poderia ser prejudicada. 

e Não existe a média de cada mês! Essa coluna também 
será calculada pelo componente do gráfico do relatório. 
Da mesma forma que o ponto anterior, fazer o cálculo 
no relatório será uma operação bem mais rápida do que 
se fôssemos resolver em uma função AVG do SQL que 
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atuaria em todos os registros. 


Voltando ao Visual Studio, selecione a aba Dados do 
Relatório e clique com o botão direito em Fontes de Dados . 
Em uma nova fonte, selecione aquela que havíamos criado, como 
fonte de dados compartilhada (chamada de Data Warehouse) e 
cliqueem OK : 


Altere o nome, o tipo e as opções de conexão. 


Credenciais 


Nome: 


[pw 











O Conexão inserida: 


Microsoft SQL Server 


Clique aqui para digitar ou colar uma cadeia de conexão 


@ Usar referência de fonte de dados compartilhada 


























[C] Usar transação única ao processar as consultas 

















Cancelar 




















Na mesma aba de Dados do Relatório , clique com o botão 
direito em Conjunto de Dados e vamos adicionar o comando que 
fizemos anteriormente. Dê o nome de Receita Mensal e cole 
nosso comando na área de texto: 
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Escolha uma fonte de dados e crie uma consulta. 


Campos 


Opções Nome: 





Filtros ReceitaMensal 











Parâmet 
arâmetros O Usar um conjunto de dados compartilhado, 


(8) Usar um conjunto de dados inserido em meu relatório. 


Fonte de dados: 
DW 

















Tipo de consulta: 
®© Texto Tabela O) Procedimento Armazenado 


Consulta: 





Declare QDataAtual Date = (Select max(data) from D Data) 
Declare QDataAnterior Date = (Select dateadd(year,-1,QDataAtual)) 











Select 

Month(Data) as Mes, 

Sum(Vlr UNitario * Qtd vendida) as VirAtual,| 

O as VlrAnterior 

from F VendaDetalhe as a 

where a.Data between dateadd(month,-5, ODataAtual) and GDataAtual 
group by Month(Data) 

union all 

Select 


a 

















Designer de Consulta... Atualizar Campos 











Tempo Limite (em segundos): 
PE 














OK Cancelar 














Clicando em OK, teremos agora os campos disponíveis para 
serem inseridos em tabelas, gráficos etc.: 
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Dados do Relatório 
Novo ~ Editar.. X 1 


b E Campos Internos 
E Parâmetros 


b E Imagens 
4 | Fontes de Dados 


gow 
4 “=! Conjuntos de Dados 


4 EE] ReceitaMensal 
E Mes 
H VirAtual 
E VirAnterior 





Já que temos os dados disponíveis, vamos colocá-los em um 
gráfico! Arraste um componente Gráfico da Caixa de 
ferramentas para o canvas, e selecione o primeiro tipo dos 
gráficos de coluna. Clicando sobre o gráfico, aparecerá um 
assistente de Dados do Gráfico. Arraste o campo Mês do nosso 
conjunto de dados para o campo Grupo de Categorias . Arraste 
os valores atual e anterior para o campo de Valores . Estaremos 
com algo parecido com o seguinte: 
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80 


o 
© 


Titulo do Eixo 


Mes A 
Mes B 








As 





Título do Eixo 





Título do Gráfico Dados do Gráfico 


BE Vir Atual 
WE Vir Anterior E Valores 





wl Virtual 
[Sum(vlrâtual)] 

Wl Vitânterior 
[Sum(Wvlrânterior)] 





Mes C Mes E 
Mes D Mes F 


R 
H Grupos de Categorias 


O RISE 





E Mes 





[HH Grupos de Séries 


























EMPRESA DASHBOARD DE VEN 








Ainda na área de Valores do assistente de Dados do Gráfico, 
clique no sinal de + (mais) em verde, e selecione Expressão... 


Na caixa de expressões, digite: 


=(Fields!VlrAtual. 


Value+Fields!VlrAnterior.Value)/2 


Aparecerá um conjunto de valor chamado Series , que será 


nossa média! Vamos alterar seu nome e o tipo de gráfico para 
transformá-lo em uma linha. Clique na seta que aponta para baixo 


ao lado da palavra Series , e selecione Alterar o tipo de 


gráfico... . Sele 


cione o primeiro tipo de Linha. 


Clique novamente na mesma seta e selecione Propriedades da 


Serie . Vá em Legenda e digite Media na caixa Texto da 


Legenda Personalizada . Teremos algo como: 


5.3 CRIAÇÃO E PUBLICAÇÃO DO DASHBOARD 


161 


a T 
Título do Gráfico 








EE Vir Atual 

e ms Vir Anterior 
is — Média 

o 

d 

2 

= 

= 

Mes B Mes D Mes F 
Título do Eixo 
e Du] 








7 Dados do Gráfico 


Tsex 
£ Valores 


dr 





Wl] Virôtual 
[SumiVlrâtual)] 
ul Vlrânterior 
[SumtVlrânterior)] 
= Series 
«Expr.» 


44 4 44 4 





EJ Grupos de Categorias 





E Mes 








H Grupos de Séries 














Podemos excluir os títulos dos eixos e formatar o valor do eixo 
Y (clicando com o botão direito sobre ele e selecionando 


Propriedades do eixo vertical ) para número sem casas 
decimais e com exibição em milhar (dividido por mil). Altere o 
título do gráfico para Receita Mensal (R$M) e pronto! Clique em 


Exibir para ver o resultado: 


Volume de Vendas (R$M) 


6.000 


4.000 


Temos nosso primeiro gráfico de dad 





E Vir Atual 
DDD Vir Anterior 
— Media 


os que saíram de um 


sistema transacional, percorreram todo o ETL até o DW, foram 


selecionados em um conjunto de dados e apresentados em um 
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gráfico amigável e bastante significativo! Já de bate-pronto, notamos 
que: 


e Temos um volume de venda maior nesse ano do que o 
ano anterior; 

e O volume de vendas de fevereiro é bem baixo (foi assim 
no ano corrente e no anterior); 

e Julho está ainda bem abaixo do ano passado, mas que 
tem uma tendência de passar o mês anterior. 


Vamos criar agora o gráfico de Análise de Volume e 
Participação por Produto, que ficará junto com o Volume de 
Vendas no nosso dashboard. Novamente, faremos um esboço do 
que devemos criar para embasar nosso raciocínio: 


ppeslise Por Prape: 





VE e N | Pa nTa ação 
“Proru TOS | ! Loe LADO E 
Provo? 3100 ZOC | 
a a +— 1 
Faonuros Lo 35 2 
Provu Go o ja to D 
fropurps l 259 | 20O | 


Teremos então uma tabela com os dados do ano passado e do 
ano correte, tendo ao lado um gráfico de pizza com o percentual de 
participação de cada produto. Esses dados levarão em consideração 
os TOP 10 produtos pelo total de valor de vendas do ano anterior 
(para contemplar o efeito de vendas sazonais que ainda possam 
afetar os dados do ano corrente). Novamente, vamos começar 
criando o comando do SQL que trará as informações até o relatório. 
O comando será conforme a seguir: 


Declare (AnoAtual char(4) = (Select year(max(data)) from D Data) 
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Declare (QAnoAnterior char(4) = (Select Year (dateadd(year, -1, QAnoAt 
ual))) 

declare QTotalVenda decimal(18,2) = (select Sum(Vlr UNitario * Qtd 
vendida) from F VendaDetalhe where year(Data) = (QAnoAnterior) 


Select top 10 

b.Nome, 

VlrAtual = (Select Sum(Vlr UNitario * Qtd vendida) 
from F VendaDetalhe as x 
where x. Id Produto = b.Id Produto 


); 


Sum(Vlr_UNitario * Qtd_vendida) as VlrAnterior, 
Sum(Vlr_UNitario * Qtd vendida)/QTotalVenda as percentual 
from F_VendaDetalhe as a inner join D_Produto as b 

on a.Id_Produto = b.Id Produto 

where year(a.Data) = @AnoAnterior 

group by b.Id produto, b.Nome 

order by 3 desc 


Vamos criar um novo conjunto de dados no relatório, tal qual 
fizemos para o primeiro gráfico, nomeando-o de Participação 
Produto , colocando nele o comando SQL anterior. 


Como vamos querer a tabela e o gráfico de pizza alinhados, 
arraste a ferramenta Retângulo para dentro do canvas, e alinhe-o 
com o gráfico já existente. Expanda para que ele fique com a mesma 
área do gráfico de Volume de Vendas. 


Depois, arraste a ferramenta Tabela para dentro do retângulo. 
Arraste os campos do Participação Produto para dentro dela, e 
formate os números e textos para que fiquem de acordo com a 
identidade visual que você quer dar. 


Como apresentamos os números em milhar (divididos por mil) 
no primeiro gráfico, vamos manter o padrão na tabela também! A 
formatação é feita para cada célula, clicando-se com o botão direito 
sobre ela e selecionando Propriedades da caixa de texto. 


Para colocar um título na tabela, clique com o botão direito 
sobre a primeira linha e selecione Inserir linha acima 
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Selecione as células dessa nova linha, clique com o botão direito e 
selecione Mesclar células . Nessa nova linha de uma única 


célula, digite Top 10 Produtos por Vlr Venda. 


Feito o trabalho com a tabela, vamos inserir um gráfico, 
arrastando Gráfico para dentro do retângulo, ao lado da tabela. 
Tal qual fizemos no primeiro gráfico, insira o Nome na Série e o 

Percentual na área de Valores. Nomeie o gráfico e arraste a 
legenda para a parte de baixo. O resultado deve ser algo como: 





AL 
Dados do Gráfico 




















Top 10 Produtos por Vir Venda (R$M) 
Nome Vir Anterior Vir Atual ? A 
[Nome] [Virânterior]  [VirAtual | E Valores da 
: || 1) percentual 
[Sumípercentual)] X 
Saasiiipapsikbs si O nsscennsstesnaceennsserensss onies 
Nome1 MM Nome3 Nome 5 i 
Nome2 MM Nomes BH Nomes E rupak dé Categanik de 
ssa esa come) IE Nomé z 
M] Grupos de Séries dk 


























E executando o modo e Exibir , devemos ter algo como: 


Top 10 Produtos por Vir Venda (R$M) Participação Produto 





Nome Vir Anterior Vir Atual 
Mountain-200 Black, 38 2.179 4.406 
Mountain-200 Black, 42 1.937 4.014 
Mountain-200 Silver, 38 1.794 3.696 
Mountain-200 Black, 46 1.616 3.311 
Mountain-200 Silver, 46 1.599 3.436 
Mountain-200 Silver, 42 1.568 3.441 MM Mountain-200 Black, 33 MM Mountain-200 Siver, 46 
DS Mountain-200 Black, 42 = Rosd-250 Black, 44 
Road-250 Black, 44 1.280 2.518 ME Mountain-200 Black, 46 MM Rosd-250 Black, 43 
MM Mountain-200 Siver, 38 MM Rosd-250 Black, 52 
Road-250 Black, 48 1.170 2.348 Mountain-200 Silver. 42 WE Touring-1000 Blus, 60 
Road-250 Black, 52 1.004 2.012 
Touring-1000 Blue, 60 892 1.729 
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Novamente, quando colocamos os dados em um dashboard, 
podemos entender quais são os produtos mais vendidos e as 
relações percentuais entre eles. Combinando com as vendas mensais 
do primeiro gráfico, podemos ter uma ideia de previsão de estoque, 
sazonalidade etc. 


Para finalizar esse painel, vamos inserir a visão por cliente com a 
Análise de Volume e Participação por Cliente. A ideia é visualizar 
os principais clientes e suas participações mês a mês para definirmos 
as tendências (se um cliente está diminuindo suas compras, se outro 
está aumentando etc.). Temos a seguir um exemplo do que seria o 
esboço dessa análise: 


Vendas Pon Qae vI: 








A ideia é mostrar os TOP 5 clientes e os volumes financeiros de 
cada um deles na evolução mês a mês. Para fazer essa busca, vamos 
precisar do seguinte comando no SQL: 


Declare @DataAtual Date = (Select max(data) from D_Data) 


Select 

Month(a.Data) as Mes, 

b.Nome, 

Sum((a.Vlr Unitario * a.Qtd Vendida)) as Vir 

from F VendaDetalhe as a inner join D Cliente as b 
on a.Id Cliente = b.Id Cliente 
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where a.Data between dateadd(month, -5, QDataAtual) and QDataAtual 
and a.Id Cliente in (Select Id cliente 
from ( 
Select top 5 
Id cliente, Sum((Vlr Unitario * Qtd Ve 
ndida)) as vlr 
from F VendaDetalhe 
where Data between dateadd(month, -5,@ 
DataAtual) and @DataAtual 
Group by Id cliente 
order by 2 desc 
) as x) 
group by Month(a.Data), b.Nome 
order by 1,2,3 


Fizemos então uma seleção de valor mensal de compra dos TOP 
5 clientes dos últimos 5 meses. Se seguirmos os mesmos passos de 


criação de gráficos que já fizemos nos exemplos anteriores, teremos 
como resultado o seguinte gráfico de linhas: 


Participação por Cliente 


100 — Andrew Dixon 

—— Carlton Carlisle 
— Kathleen Garza 
= Kirk DeGrasse 


Terry Eminhizer 





Notamos que todos os clientes selecionados estão com uma 
tendência de alta, alguns mais agressivamente do que outros. Ainda 
assim, não tivemos compras deles nos meses 2, 4, 5 e 7! Essa 
situação pode denotar que um trabalho para aumentar a perenidade 
das compras pode ser uma estratégia comercial faltante, mesmo 
com os clientes que mais compram. 


Executar nosso relatório em modo Exibir nos trará a visão de 
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como o produto final será visto por nossos usuários: 


SUA w 


EMPRESA DASHEOARD DE VENDAS 


To 19 Produtos por Vir Venda (eS14) Participação Produto 
Roma Ve Anterior vi Atual 


aum cam a 
vast sou d 
7i on 

w T 

vam ses 


Volume de Vendas (R$M) 











Participação por Cliente 











03/06/2016 161012 


Uma boa prática nesse momento é apresentar esse relatório 
antes mesmo de publicá-lo a fim de ter o “aceite” dos usuários. 
Cores, títulos, disposições sempre sofrem alteração no momento em 
que se apresenta o produto final ao usuário. Estando tudo aprovado, 
vamos ao processo de publicação! 


No segundo capítulo, quando instalamos o SQL e configuramos 
o Reporting Services, havíamos visitado o site de relatórios, que no 
nosso exemplo é http://localhost/reports BIPRD . Se 


entrarmos novamente nesse endereço, veremos a página inicial do 
SSRS! 


O que faremos é organizar nossos relatórios em pastas. Essa 
organização facilitará o processo de permissão. Uma boa prática é 
criar uma pasta para cada departamento, e nela colocar os relatórios 
que serão acessados pelos usuários daquela área. Uma pasta 
Presidência ou Board pode ser criada para um público que verá 
os dados mais sensíveis da empresa. Vamos usar esse exemplo e 
colocar o nosso dashboard comercial em uma pasta chamada 
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Board. 


Antes de colocarmos nosso relatório no SSRS, temos de criar 
uma fonte de dados que será vinculada a ele. Como é um 
componente necessário apenas para o funcionamento dos 
relatórios, os usuários não precisarão visualizá-la. Clique em Nova 
Pasta e dê o nome de DataSources . Cheque a opção Ocultar 
na visão lado a lado . Isso fará com que ela seja ocultada para os 
usuários em geral. 

Página Inicial 


SQL Server Reporting Services 


La Nova Pasta 


Crie uma nova pasta em Página Inicial. 





Nome DataSources 








Descrição 














[4] Ocultar na exibição lado a lado 


| Cancelar 


Depois, crie outra pasta chamada Board e não selecione a 
opção de ocultar. Com as duas pastas criadas, nossa página inicial 
do SSRS estará assim: 





Página Inšoal | Configurações de Site | Ajuda 
SQL Server Reporting Services 


Eh Página Inicial F: 
Z Nova Pasta 1 Nova Fonte de Dados Dá Configurações de Pasta É Carregar Arquivo 1) Exibição de Detalhes 
sá Board 


Ao lado direito, existe o ícone Exibição de Detalhes . Clique 
nessa opção e veja que as duas pastas que criamos passaram a ser 
exibidas (uma abaixo da outra). Clique na pasta Datasources , e 
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depois em Nova Fonte de Dados . Vamos criar uma fonte de 
dados (tal qual fizemos no Visual Studio), preenchendo servidor, 
banco de dados, usuário e senha, conforme a seguir: 





Página Inicial = DataSources 


SQL Server Reporting Services 


s Nova Fonte de Dados 


E 








Nome Datawarehouse 








Descrição Datasource para o DW 





Cl Ocultar na exibição lado a lado 











v| Habilitar esta fonte de dados 
Tipo de fonte de dados: | Microsoft SOL Server v 

















Cadeia de conexão Info=True;User ID=Bl USER Initial 
Catalog=DW Data Source=WIN- 


2073028G8MABIPRD 





Conectar usando: 
> Credenciais fornecidas pelo usuário que está executando o relatório 
bir o seguime texto a0 solicitar um mom e usuário e um 
mene msia um nome de uUsuano = uma senha tara acessar a fi 


credenciais-do Windaws ap coneciar-se ntede da 


8) Credenciais armazenadas com segurança no servidor de relatório 





Nome de usuário: |Bi User | 











Senha: vococooo | 





_]Usar as credenciais do Windows ao conectar-se à fonte de dados 





[| Representar o usuário autenticado depois que uma conexão é estabelecida com a fonte de dados 


I Segurança integrada do Windows 


O Não são necessárias credenciais 


Conexão criada com êxito 


OK | Cancelar 

















Clique em Testar Conexão e, tendo tido êxito, clique em OK. 
Volte para a página inicial do SSRS onde veremos a pasta Board . 
Clique nela e depois em Carregar Arquivo . 


Clique em Procurar... para subir o arquivo do nosso 
dashboard. Para tanto, vá na pasta da solução do Visual Studio e 
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ache o arquivo Dashboardvendas.rdl . Este é o que o Visual 
Studio cria com as definições de relatório e, carregando-o para o 
SSRS, teremos o relatório executado diretamente no browser! 


Por padrão, o seus arquivos .rdl devem estar na pasta com o 


nome da solução dentro de | DocumentosNvisual Studio 
2013\projects\.... 









© A O E » Meu computador » Documentos » Visual Studio 2013 » projects » BI » BI » {v 6] | Pesqu 





Organizar v Nova pasta 

















er Farob Nome Data de modificaç... Tipo Tamanho 
EE Área de Trabalho ds bin Pasta de arquivos 
r3 Downloads Ei Bl.rptproj Report Project File 4KE 
E] Locais recentes Ñ) Bl.rptproj.user Visual 5 Proj. 3KB 
| E DashboardVendas.rdl Report Definition ... 61KB| 
183 Meu computador | | DashboardVendas.rdl.data Arquivo DATA 14 KB 
(iè Área de Trabalho | | DataWarehouse.rds Arquivo RDS 1KB 
'E| Documentos 
“8 Downloads 
E Imagens 
(a Músicas 
JE Vídeos 


i Disco Local (C:) 


Clicando em abrir ao selecionar o arquivo, retorna-se para a 
tela de upload. Você pode alterar o nome do arquivo para um nome 
mais amigável (colocando “de? entre Dashboard e Vendas, por 
exemplo): 
|] SOL Server Reporting Services 
| do Carregar Arquivo Ee Ia 
| = 
| Carregar um relatório (.rdl), modelo (-smdl), conjunto de dados compartilhado ( rsd). parte de relatório (sc) ou outro recurso em Página Inicial. 

Arquivo a ser camegado C:jUsersjAdministradorDocum Procurar... 


Nome Dashboard de Mendas x 


[Cl Substituir item, se existir 


Cancelar 

















Clique em OK eo relatório estará publicado! Selecione a seta ao 
lado direito do relatório e clique em Gerenciar . Selecione a aba 
Fonte de Dados à esquerda e note a mensagem de erro: A 
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referência da fonte de dados compartilhados não é mais 
válida . Para corrigir esse problema, clique em Procurar e 
selecione a fonte de dados que criamos há pouco no SSRS: 


SQL Server Reporting Services 


A Dashboard de Vendas 


Propriedades 
E E Procure pastas para selecionar uma fonte de dados compartilhados a ser usada com esse item 
Fontes de Dados 











Local: |/DataSources/Datawarehouse 





Sequrança 
S-E Página Inicial 
(EH Board 


DataSources 








E) Datavarehouse 


Cliqueem ok eem aplicar na tela anterior (não se esqueça 
de clicar no Aplicar !). Volte para a página inicial e clique 
novamente em Board para ver nosso relatório publicado: 


SQL Server Reporting Services 


E Board [Pesquisar Lo 
E Nova Pasta “É Nova Fonte de Dados [Ed configurações de Pasta t Carregar Arquivo LH Exibição de Detalhes 
E) Dashboard de Vendas 


Clique no relatório e ele será exibido tal qual foi construído no 
Visual Studio: 
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dei i dam 


EMPRESA DASHBOARD DE VENDAS 


Top 10 Produtos pes Vir Venta GSM) 


Vetumo de Vendas (RSM) Participação Produto 


nome Vie Anterior vm Anssi 


| ren Vanian 280 Bo 38 nmo am ra 
| Mega Mountan-200 Dica 42 1 an 
10004 Mountan-209 avee. 28 E 205% 
| Siaa ool ai 
| tsect-200 sor a0 m sam 
20004 Woriain 209 Siver 42 i su ; 
Rand 280 Be. 44 m as 
| Roa6-250 Dica 4 un 23e - z 
e TS R ET 


Raas 240 Maca 42 1804 am 





Tasg- 1090 tan t0 w ua 


Participação pos Cliente 








01082016 16 10.12 


Bastará informar a URL do SSRS, ou colocá-la em um link na 
sua intranet, que seus usuários acessarão os relatórios que, por sua 
vez, estarão acessando os dados do DW que, novamente, serão 
carregados diariamente! Sem intervenção nenhuma, os dados 
passam das origens para os consumidores! 


A dúvida que deve ter lhe acometido agora é quanto à 
segurança! Como garantir que somente um determinado público 
tenha acesso a cada uma das pastas? O SSRS funciona atribuindo-se 
papéis aos usuários (ou grupo de usuários) para cada pasta. Na aba 
de Configuração do site (bem acima e à direita) e 
Configuração da Página (ao lado de Subir Arquivo ), existem 
as opções de segurança nas quais se inserem os usuários e se define 
os papéis de cada um. 


Um estudo detalhado do SSRS é muito recomendado nesse 
ponto não só para as questões de segurança e acesso, mas também 
para a criação de relatórios avançados, incorporação de ferramentas 
externas etc. Recomendo fortemente a leitura do livro Pro SQL 
Server 2012 Reporting Services. Ele trata da versão 2012 e Enterprise, 
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e nós estamos usando a 2014 Express. Mas não se preocupe. A 
diferença de ano não tornou o livro obsoleto. Ter em mãos um livro 
com as funcionalidades das versões completas do produto pode ser 
bastante útil! Claro que uma vasculhada nas lojas lhe renderá uma 
centena de outras opções de bons livros sobre o tema (quem sabe eu 
escreva um também ©)! 


Mas tal qual o T-SQL, não deixe de se aprofundar nos 
conhecimentos do SSRS! 


5.4 CRIAÇÃO E PUBLICAÇÃO DO RELATÓRIO 
DE DETALHE 


Fizemos um dashboard com o Reporting Services que será 
consumido pelo nível corporativo de consumo de dados, e agora 
vamos criar um relatório detalhado para atender ao nível 
departamental. Por definição, Business Intelligence serve à tomada 
de decisão e não seria focado em questões operacionais. Mas temos 
os dados todos no nosso DW, e dar suporte à operação se torna 
quase que um ganho colateral. 


O exemplo seria um relatório de Posição do Cliente. Imagine 
que um vendedor vai efetuar uma visita comercial e quer saber o 
resumo do relacionamento desse cliente com a empresa. Nesse 
relatório, nosso vendedor escolherá o cliente e o relatório exibirá os 
dados conforme a seleção! Um esboço do nosso relatório seria algo 


assim: 
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pus (so? dg Avé DIA 
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O interessante desse exemplo é que se trata de um relatório para 
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o qual vamos passar parâmetros, ou seja, o resultado dele dependerá 
da seleção do cliente que queremos consultar. Extrapole esse 
exemplo para suas necessidades e quase qualquer consulta pode ser 
resolvida através da passagem de parâmetros! 


Vamos iniciar esse desenvolvimento deixando nossa área de 
relatórios do Reporting Services preparada para receber o upload do 
«rdl que criaremos para o departamento comercial. Assim sendo, 
na página inicial do Reporting Services, crie uma pasta chamada 
Comercial . Ela ficará ao lado da pasta Board , já existente. Assim 
que tivermos o relatório pronto, será lá que o colocaremos: 





É hep /lacaihost/Repors SIPAD/Pages/Foider asp P ~- €| 43 Home- Report Manage 


SQL Servet Reporting Services 


E Home Sear 
La New Folder “4 New Data Source H Folder settings Tt upload File 
“3 Comercial 
R Board B Relatórios dy Departamento Comercial 


Quanto ao desenvolvimento propriamente dito, começaremos 
clicando com o botão direito no item Relatórios do 
Gerenciador de Soluções e selecionar AdicionarkNovo Item. 
Selecione Relatório e nomeie como PosicaoCliente.rdl e, 
depois de criado, coloque o cabeçalho e o rodapé tal qual fizemos no 
dashboard. 


Para criarmos esse relatório, vamos precisar dos seguintes 
conjuntos de dados distintos (e para cada um, um comando SQL): 


e ListaClientes : esse conjunto de dados listará quais 
são os clientes disponíveis para nosso filtro! A seleção 
de dados será conforme a seguir (e deve ser inserida no 
campo de consulta do nosso conjunto de dados como 
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fizemos nos exemplos anteriores): 


Select 

Id Cliente, 
Nome 

from D Cliente 
order by Nome 


DadosCliente : crie um novo conjunto de dados. Esse 
conjunto trará os dados do nosso cabeçalho. No 
exemplo, traremos nome, e-mail e o código pelo qual o 
cliente é conhecido. A seleção de dados será conforme: 

Select 

nome, 

Cod Cliente, 

Email 

from [dbo].[D Cliente] 

where Id Cliente = QIdCliente 
Note que, assim que o conjunto de dados for criado, 
um parâmetro chamado idcliente foi inserido 
automaticamente na aba de parâmetros! 





$ s do Relatório 


Novo «Editar. O d 


b I Campos Internos 





4 Parâmetros 
b E Imagens 
b = Fontes de Dados 
4 Conjuntos de Dados 
4 ListaClientes 
E ld Cliente 
E Nome 
á DadosCliente 
A nome 
H Cod Cliente 
E Email 
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Isso porque o Reporting Services entende que a variável 
QIdCliente deverá ser preenchida pelo usuário 
quando o relatório for solicitado e já cria o parâmetro. 
Vamos terminar de criar os conjuntos de dados e 
voltaremos para configurar esse nosso parâmetro! 


e VendasMensal : esse novo conjunto responderá pelo 
gráfico de vendas mês a mês (e note que é um comando 
bastante similar ao que fizemos no nosso dashboard, 
apenas incluindo a separação pelo cliente em questão): 


`` Declare GDataAtual Date = (Select max(data) from 
D Data) Declare coDataAnterior Date = (Select 
dateadd(year,-1,DataAtual)) 


Select 
Month(Data) as Mes, 
Sum(Vlr UNitario * Qtd vendida) as VlrAtual, 
© as VlrAnterior 
from [F VendaDetalhe] as a inner join [D Cliente] as b 
on a.Id Cliente = b.Id Cliente 
where a.Data between dateadd(month, -5, QDataAtual) and @DataAtual 
and a.Id Cliente = QIdCliente 
group by Month(Data) 
union all 
Select 
Month(Data) as Mes, 
O as Vlratual, 
Sum(Vlr UNitario * Qtd vendida) as VlrAnterior 
from [F VendaDetalhe] as a inner join [D Cliente] as b 
on a.Id Cliente = b.Id Cliente 
where a.Data between dateadd(month, -5, QDataAnterior) and QDataAnte 
rior 
and a.Id Cliente = QIdCliente 
group by Month(Data) 


e ProdutosMensal : esse novo conjunto de dados será 


responsável pelo gráfico de consumo dos produtos do 
nosso cliente em sua distribuição mensal: 
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“º Declare @AnoAtual  char(4) 
year(max(data)) from D Data) 


Select 

b.Nome, 

month(a.Data) as Mes, 

Sum(Vlr UNitario * Qtd vendida) as VlrAtual 

from F VendaDetalhe as a inner join D Produto as b 
on a.Id Produto = b.Id Produto 

where year(a.Data) = @AnoAtual 

and a.Id Cliente = QIdCliente 

group by b.Nome, month(a.Data) 


(Select 


e NotasFiscais : esse novo conjunto de dados trará as 
últimas 10 compras feitas pelo cliente com os detalhes 
como número da nota, data da compra e valor de cada 


item, e preencherá os dados da tabela de NFs: 


Select TOP 10 
a.Nr NF, 
a.Data, 


Sum(Vlr UNitario * Qtd vendida) as VlrAtual 


from F Venda as a inner join F VendaDetalhe as b 


on a.Data = b.Data 
Nr NF = b.Nr NF 
Id Cliente = b.Id Cliente 


a. 

a. 

a. Id Funcionario = b.Id Funcionario 
a. Id RegiaoVendas = b.Id RegiaoVendas 


where a.Id Cliente = QIdCliente 
group by a.Nr NF, a.Data 
order by a.Data 


and 


and 


and 


Feitos os conjuntos de dados, voltemos ao nosso parâmetro! 
Note que todos os conjuntos posteriores à lista de clientes possuem 
a mesma variável @IdCliente . Por isso mesmo (por termos 
mantido sempre o mesmo nome de variável), temos somente um 
parâmetro criado para nosso relatório. Se executarmos o relatório 
(clicando em Exibir ) sem nenhuma informação, já notaremos 
que esse parâmetro será solicitado antes de que o corpo do relatório 


seja exibido: 
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À Criar FERE 








ld Cliente É Exibir Relatório 











js 
a! 


Vemos que o Id Cliente é solicitado e que tem-se o botão 
Exibir Relatório que fará a requisição. Como esse id é uma 
informação interna do nosso DW, o usuário não tem como 


preencher esse campo! 


O que faremos agora será criar uma forma amigável de 
preenchimento desse dado! Volte ao modo de edição do relatório 
( Criar ) e clique com o botão direito sobre o parâmetro e selecione 

Propriedades do Parâmetro : 









Novo ~ Editar... x Gy 


> um Campos Internos 









4 i Parâmetros 






X Excluir 





b E Imagens 





b E Fontesc & Propriedades do Parâmetro 
4 = Conjuntos de Dados i | o 
4 El lictaflianter 


Na aba Geral, vá para a caixa prompt (que é o texto que será 
exibido ao usuário), troque Id Cliente por Selecione o 
Cliente: . Selecione a aba Valores Disponíveis e preencha 
com os dados do conjunto de dados que criamos, chamado 
ListaClientes , conforme a figura demonstra: 
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Escolha os valores disponíveis para este parâmetro. 


Valores Padrão Selecione uma das seguintes opções: 


Avançado O Nenhum 
O Especificar valores 


(9) Obter valores de uma consulta 


Conjunto de dados: (Aviso: possível impacto no desempenho) 





ListaClientes 





Campo de valor: 





ld Cliente 





Campo de rótulo: 











Nome 




















Cancelar 




















Ou seja, teremos os valores obtidos de uma consulta que será a 
ListaClientes , cujo campo de valor (que será passado aos 
conjuntos de dados) será o IdCliente e o campo de rótulo (que 
será visualizado pelos usuários) será o Nome ! Se executar 
novamente o relatório no modo de exibição, notará que o 
parâmetro já trará a lista dos clientes para serem selecionados. 
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PosicaoCliente 





ra saie 


È Criar E 


Selecione o Cliente: | «Selecione um Valor> {v Exibir Relatório 


— A. Leonetti E - E eme 
de > | Aaron Adams t | | 100% ~- 

Aaron Alexander 

Aaron Allen 

Aaron Baker 

Aaron Bryant 

Aaron Butler 

Aaron Campbell 

Aaron Carter 

Aaron Chen 

Aaron Coleman 

Aaron Collins 

Aaron Con 

Aaron Diaz 

Aaron Edwards 

Aaron Evans 

Aaron Flores 

Aaron Foster 

Aaron Gonzales 

Aaron Gonzalez 

Aaron Green 

Aaron Griffin 

Aaron Hall 

Aaron Hayes 

Aaron Henderson 

Aaron Hernandez 

Aaron Hill 

Aaron Hughes 

Aaron Jai m 
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Ajustado o parâmetro, podemos criar nossos componentes 
gráficos para serem exibidos no relatório. Vamos iniciar colocando 
os dados do cliente como um cabeçalho! A ideia é deixar esses dados 
em destaque, com uma fonte um pouco maior para rápida 
identificação. 


Para tanto, vamos arrastar o componente Caixa de texto 
três vezes para a área do relatório e atribuir a cada um deles os 
valores do conjunto de dados DadosCliente . Assim, basta clicar 
com o botão direito em cada caixa e selecionar Expressão... 
Para cada uma, selecione os valores do conjunto de dados desejado 
com o comando: 


=First(Fields!nome.Value, "DadosCliente") 


Podemos ajustar a fonte, colocar uma linha acima e outra abaixo 
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dos dados do cliente, enfim, deixar da forma que nossos usuários 
desejam! Feita essa parte simples, podemos executar o relatório pelo 
modo Exibir e selecionar um cliente qualquer no parâmetro. O 


relatório já trará os dados desse cliente: 





Seiegene o Ceme Ruben Hemandez ~ bat Fataiços 


$ dos um 


EMPRESA POSIÇÃO CLIENTE 
Ruben Hernandez - AW00021036 


ruben27 (Dadventure-works.com 





Vale mencionar que qualquer informação relevante de Cliente 
que esteja disponível em sua empresa deve ser levada ao DW e, 
eventualmente, apresentada nesse relatório. É sempre útil incluir 
dados como endereço, telefones, cargo etc. 


Avançando para o gráfico de vendas mês a mês, bastará 
recriarmos os passos do dashboard, arrastando o componente de 
gráfico para o relatório, arrastando os dados de Valores e Mês do 
conjunto de dados VendasMensal e criando o campo calculado de 
média. Se tiver alguma dúvida, retorne ao exemplo do dashborad. 
Nosso resultado ficará como o a seguir: 


Vendas Más a Mós 


1 
nos | 
vos 
] E 
0.00 
Mes à Mes 8 Mes Č Mes D Mes E Mes F 
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Arraste um outro componente de gráfico logo abaixo desse que 
fizemos e siga os mesmos passos de criação do gráfico anterior, mas 
agora com o conjunto de dados Produtos Mensal . Teremos um 
novo gráfico: 


Produtos Mês a Mês 


— Nome A 
0 — Nome B 





Mes A Mes B Mes C Mes D Mes E Mes F 


Vamos colocar uma tabela logo abaixo e vamos vinculá-la ao 
conjunto de dados de Notas Fiscais. Para tanto, arraste uma tabela 
para baixo do último gráfico. Por padrão, ela terá três colunas 
(exatamente o que necessitamos) e duas linhas, sendo que a 
primeira é um cabeçalho e a segunda conterá os detalhes, que no 
nosso caso será de 10 linhas. 


Arraste os campos do nosso Conjunto de Dados de Notas 
Fiscais diretamente para a célula de Detalhe, primeiro o NrNF , 
depois a Data e, por último, o VlrAtual . Note que o cabeçalho 
recebeu esses nomes. Podemos editá-lo para nomes mais 
significativos, inclusive adicionando uma nova linha acima do 
cabeçalho (e fazendo o “merge” das colunas) para conter o nome da 
nossa tabela! O resultado ficará assim: 


Últimas 10 Vendas 
Nota Fiscal Data Valor Total 
66392 18-03-2008 R$4,99 


Dessa forma, o relatório encontra-se finalizado e podemos 
executá-lo em modo de exibição para avaliar o resultado. Lembre-se 
de formatar os campos e alinhar os componentes todos, a fim de 
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tornar a exibição o mais agradável possível. 


Uma vez estando tudo certo, vamos repetir o processo de upload 
do arquivo .rdl na pasta que criamos para o Comercial: 


SQL Server Reporung Services 


Lud Comercial Ex 
La Nova Pasta M Nova Fonte de Dados A Configurações de Pasta t Carregar Arquivo Lil Exibição de Detalhes 


beca] Posição Cliente 


Executando esse relatório, o comportamento será ligeiramente 
diferente, porque, por ter a necessidade de parâmetros, teremos de 
selecionar o Cliente antes de termos a exibição de alguma 
informação: 


Selecione n Chame: | <Sadecone um valor v Exibe Nelavena 


Tendo selecionado um Cliente e clicando-se em Exibir 
Relatório , à direita, o relatório é exibido com os dados do Cliente 
selecionado: 
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EMPRESA POSIÇÃO CLIENTE 
Pearlie Rusek - AW00021945 


pearlieO(Dadventure-works.com 








Vendas Mês a Mes 








Produtos Més a Més 





J 
2 
2 & 
1 
1 
ò 
4 
Últimas 10 Vendas 
Nota Fisal Data Valor Total 
47475 0309-2006 R52.443,25 
88724 21-04-2008 RS2.442,25 


5.5 CRIAÇÃO E DISPONIBILIZAÇÃO DA 
PLANILHA DE CONSULTA DINÂMICA 


Fizemos a criação de alguns relatórios para disponibilizarmos 
para nossos diretores, gerentes comerciais e vendedores, atendendo 
às demandas corporativas e departamentais. Mas, muito 
provavelmente, esses relatórios não atenderão a todas as 
necessidades, e mais e mais solicitações de criação de novos 
relatórios serão recebidas pelo time do Business Intelligence. 


Mesmo criando relatórios de forma muito rápida (como vimos, 
o Visual Studio nos permite criar e publicar relatórios no SSRS de 
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forma extremamente performática), teremos usuários que 
necessitarão de análises complexas, buscas de fenômenos de formas 
inesperadas e dinâmicas. Para esse público, o BI Pessoal, muitas 
vezes chamado de self stracted BI (ou ainda self service BI), é o que 
deve ser entregue. 


Existem várias formas de distribuir o Business Intelligence 
Pessoal. Entretanto, vamos tratar por hora de uma das formas mais 
difundidas e versáteis: a consulta dinâmica, ou PowerPivot do Excel. 


Para tanto, temos antes que disponibilizar uma fonte de dados 
para ser conectada à planilha e possibilitar o pivoteamento de 
dados. O comando a seguir cria uma View, ou seja, uma visão dos 
dados do nosso DW. 


CUIDADO 


Faremos uma View com todos os dados do nosso DW, a fim 
de disponibilizar consultas sem nenhum tipo de limitação ao 
usuário final. Isso pode causar uma grande demora nas 
execuções e um tráfego de rede bastante pesado. 


Se performance se tornar um problema, estará na hora de 
avaliar a implantação de estruturas multidimensionais (os 
cubos do SSAS, por exemplo) em seu ambiente, ou a inclusão 


de filtros que, por exemplo, disponibilizam apenas os dados do 


ano corrente para serem trabalhados, ou os dados já 
sumarizados. 


Feita essa observação, vamos ao comando de criação da nossa 
View. 





Create View Vw AnaliseDW 
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as 
Select 
a.Data, 

c.Dia, 

c.Mes, 

c.Ano, 

d.Cod Cliente, 

d.Nome as ClienteNome, 

d.Email, 

e.Nome as FuncNome, 

e.Login, 

f.Nome as RegiaoVendas, 

g.Sigla as Pais, 

h.Nome as GrupoGeo, 

i.Nome as Produto, 

i.Cod Produto, 

b.vlr Unitario, 

b.Qtd Vendida 

From F Venda as a inner join F VendaDetalhe as b on 


a.Data = b.Data and 
a.Nr NF = b.Nr NF and 
a. Id Cliente = pb.Id Cliente and 
a. Id Funcionario =b.Id Funcionario and 
a. Id RegiaoVendas=b. Id RegiaoVendas 


inner join D Data as c on 

a.Data = c.Data 

inner join D Cliente as d on 

a.Id Cliente = d.Id Cliente 

inner join D Funcionario as e on 

a. Id Funcionario = e.Id Funcionario 
inner join D RegiaoVendas as f on 

a. Id RegiaoVendas = f.Id RegiaoVendas 
inner join D Pais as g on 

f.Id Pais = g.Id Pais 

inner join D GrupoGeografico as h 

on g.Id GrupoGeo = h.Id GrupoGeo 
inner join D Produto as i on 

b.Id Produto = i.Id Produto 

Where i.Ativo = 1 -- Apenas para Produtos ativos 


Criada a View, pode-se dar permissão pelo SQL Server por 
usuário (ou a grupos de usuários do AD) para que somente um 
determinado público tenha acesso a essa estrutura, bem como criar 
diversas views com filtros de dados na cláusula where , tendo uma 
para cada Região de Vendas, por exemplo, e para cada uma tem-se a 
permissão para um grupo do AD formado por vendedores apenas 
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daquela região. Dessa forma, implementa-se uma segurança ao nível 
dos dados que são apresentados! 


Tendo a nossa View, vamos vinculá-la a uma PowerPivot do 
Excel para podermos navegar pelos dados. Logo, seguiremos um 
passo a passo: 


1. Abrindo o Excel, clique na aba PowerPivot (conforme 
configuração que fizemos anteriormente) e clique em 
Gerenciar . Será apresentada a janela de gerenciamento da 
PowerPivot: 





Popina micial Dengu Avançado e 
í s - m 5 mê Enhição de Diagrama 
b ] Mostrar Oeutos 


Áreade Obter Dados àt 
Transferências Emernos 





2. Clique em obter Dados Externos (do Banco de Dados > 
do SQL Server) para criar uma conexão com o nosso DW. 
Renomeie a conexão para DW e aponte para nossa instância 
de SQL. Em segurança, use autenticação do Windows para 
garantir que somente usuários com as devidas permissões 
serão capazes de acessar os dados (se essa planilha for aberta 
por outro usuário, os dados não serão atualizados). 


3. Clique em Próximo e mantenha checado o item 
Selecionar itens em uma lista de tabelas e 
exibições para escolher os dados a serem 
importados . Em Próximo , aparecerá a lista de todas as 
tabelas e visões disponíveis. Selecione a vw AnaliseDwW que 
fizemos anteriormente e selecione Concluir . 
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Servidor. WIN-2073028G8MFIBIPRD 
Banco de Dados: DW 













































































Tabelas e Modos de Exibição: 

[I Tabela de Origem Esquema Nome Amigável Detalhes do Filtro 
Dig | D_Cliente | dbo 

DIE | Data | dbo | | 
DIE | D. Funcionario dbo | 

(O [ES | DGupoGeogrfico | dbo 

DE |DPais dbo | 

DIE | D-Produto |do | a! 

[ES | D_RegiaoVendas  |dbo | = 

O = F_Venda | dbo | 

C |E | E VendaDetahe dbo | | | 
o0 [E | sysdiagrams | dbo | 





o 








Selecionar Tabelas Relacionadas | | Visualizar e Filtrar| 


| p | Concluir Cancelar 

















4. Assim que a importação terminar, clique em Finalizar e os 


190 


dados serão exibidos em um preview. No Ribbon da Power 
Pivot, clique em Tabela Dinâmica . Você será 
automaticamente encaminhado novamente para a planilha do 
Excel, na qual poderá selecionar a célula na qual a tabela será 
incluída. Mantenha o padrão e clique em OK. 


A área da tabela dinâmica será exibida à esquerda, e a lista de 
campos e áreas de soltura serão apresentados à direita: 
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PÁGINA INICIAL INSERIR LAYOUT DA PÁGINA FÓRMULAS DADOS REVISÃO EXIBIÇÃO POW» 


























B3 Si fe v. 
A B c D E F e E 
1 Campos da Tabela... 7 X 
2 ATIVO TUDO 
3] E= || Escolha os campos para adicionar [45 + 
2 Ei ao relatório: e 
5 aid | 
| 4 Eb vw AnaliseDW > 
6 Para criar um relatório, C Data — 
7 escolha campos na lista de Dia 
8 campos da Tabela Dinâmica Mes 
9 
10 [| Ano 
11 Cod_Cliente 
12 e ChenteNome nd 
as | = Arraste vs campos entre as áreas abaixos 
14 em 
15 T< | T FILTROS Hill COLUNAS 
16 
17 - 
18 
19 = LINHAS E VALORES 
20 
21 


) 


Adiar Atualização do L... 


Plan2 | Plant 





6. Arrastando os campos disponíveis para Filtros, Colunas, 
Linhas e Valores, pode-se montar uma infinidade de 
combinações de visualizações: 





Campos da Tabela Di... 7 = 
amo tuot 
Pais (Vários mens) 7 
vir Rótulos de Coluna ~ 
“2005 ~ 2006 ~ 2007 * 2008 Total Geral 
Rótulos de tinha - 
Central R$34812813 R$SI08206]  R$I66332ÁI R$457.49945 RS 2.682.780,88 
France R$180:571,71 RS740S4269 RS 1.693.460,61 R$1.345.334,86 RS 3.359.919,87 
Northeast R$ 268.897,30 _RSS60.353,00  RSIS2490,04 R$41053408 RS 2.482.274,42 
Nonnwest R$ 999.369,42| R$ 2.020.760,12] RS 2.443.000,90 R$2.116.112,11 RS 7.579.282.55 
Southeast R$526615,61 R$997618,39  R$90285786 R$474980,79 R$2.902032,65 
Southwest RS 1.390.058,33 R$3.251.20581 R$4.006-156,04 R$3.12518215 RS 11.772.602.33 
Total Geral R$ 3.713.680,50 R$ 8.781.300,62 R$10.954.298,14 R$ 7.929.613,44 R$ 31.378.852,70 
e >i [iw - 
Mes = 
n uwas VALORES 
Fegacvendas © [W - 


Nesse exemplo, selecionamos a comparação do Total de 
vendas das Regiões de Vendas da França e Estados Unidos, 
ano a ano. Poderíamos fazer qualquer cruzamento necessário 
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entre os dados disponíveis. Com um pouco mais de atuação 
com as opções da aba Analisar e Design da PowerPivot, 
um dashboard bem mais significativo pode ser feito com 
alguns cliques: 


= = 
mos w 
= 

œ 


m 


Enen AF -A — = 


Utilizando-se dos comandos da PowerPivot, diversos 
dashboards podem ser montados, inclusive com 
Segmentação de Dados que são os filtros por seleção (no 
exemplo, usei Ano e País) que, ao serem selecionados, afetam 
todos os gráficos e tabelas da planilha. 


Salvando a planilha, você poderá enviá-la para seu usuário, e 
este poderá trabalhar em suas próprias análises sem a necessidade 
de novos desenvolvimentos por parte da equipe de BI. Se ele receber 
uma mensagem de erro do SQL por falta de autorização, bastará 
criar um acesso para ele no Servidor (criação de um novo logon na 
aba de segurança do SQL Server) com permissão de leitura à view 
que criamos para esse fim! 


Para maiores detalhes, tanto do processo de criação dos 
dahsboards e uso dos recursos da PowerPivot quanto do processo 
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de acesso ao SQL Server mediante logons de usuário e demais 
questões como o Power Query, o livro Power Pivot and Power BI: 
The Excel User's Guide to DAX, Power Query, Power BI & Power 
Pivot in Excel 2010-2016, de Rob Collie, é uma excelente fonte de 
conhecimentos! 


5.6 CONCLUSÃO 


Vimos nossos dados ganhando vida! De um sistema 
transacional, os dados passaram por um processo de carga e foram 
armazenados em um Data Warehouse. De lá, foram postos em 
perspectiva, mensurados, avaliados e comparados! 


No próximo capítulo, veremos como estender um pouco mais as 
funcionalidades do nosso Business Intelligence sob a plataforma 
gratuita do SQL Server Express, a fim de garantir que seus 
investimentos em licenciamento só ocorram quando, de fato, forem 
imprescindíveis! 
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CarírtuLo 6 


ESTENDENDO A SUA 
PLATAFORMA GRATUITA 


6.1 ALTERNATIVA PARA A LIMITAÇÃO DE 
TAMANHO DO DATA WAREHOUSE 


Seguindo a filosofia de conter ao máximo a necessidade de 
investimento em licenças, podemos dar uma sobrevida à nossa 
plataforma gratuita quando ela estiver crescendo em tamanho do 
DW e aproximando-se do limite do SQL Server 2014 Express, que é 
de 10GB por base de dados. Fato é que, quanto maior for nosso 
DW, maior será o consumo de memória para a execução das 
consultas e maiores serão as requisições de consultas feitas contra 
ele. Ou seja, o tamanho do DW será somente um dos problemas que 
a plataforma enfrentará em seu crescimento. 


Os demais problemas não temos como contornar. Porém, este 
pode ser transposto com uma alternativa pouco ortodoxa, mas que 
surte o efeito necessário, 


Crie suas tabelas de Dimensão em uma base de dados e as Fato 
em bases diferentes! Essa abordagem simples causará um impacto 
nos processos administrativos e nas consultas (os nomes das tabelas 
terão que ser trabalhados para incluir o banco de dados), mas que 
pode ajudar a manter a plataforma utilizável por mais tempo. 


No exemplo do nosso Data Warehouse, utilizando essa 
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abordagem, teríamos algo como: 


|] DW Dimensoes 
| E DW_FatoVendas 
[I DW FatoVendasDetalhes 


+ HI 


t+ 


Os processos de carga fariam o insert do DS diretamente para a 
base DW correta, e as consultas teriam os nomes das tabelas 
completamente qualificados, ou seja, contendo o nome do banco, 
do owner, da tabela e da coluna. Algo como consulta de Volume de 
Vendas que fizemos para nosso dashboard: 


Select 

Month(Data) as Mes, 

Sum(Vlr UNitario * Qtd vendida) as Vlratual, 

O as VlrAnterior 

from DW FatoVendasDetalhes..F VendaDetalhe as a 

where a.Data between dateadd(month, -5, QDataAtual) and QDataAtual 
group by Month(Data) 

union all 

Select 

Month(Data) as Mes, 

O as VlrAtual, 

Sum(Vlr UNitario * Qtd vendida) as VlrAnterior 

from DW FatoVendasDetalhes..F VendaDetalhe as a 

where a.Data between dateadd(month, -5, QDataAnterior) and QDataAnte 
rior 

group by Month(Data) 


Note que, em vermelho, o nome da tabela passa a contar com o 
nome do banco e o “ponto, ponto” que indicam o owner padrão. 
Dessa forma, cada banco (ou seja, cada Fato) poderá ter 10GB de 
tamanho. Sua solução de BI ganhará uma sobrevida até que um 
licenciamento seja feito e um SQL Server full seja instalado, ou um 


SQL Azure contratado, o que permitirá o uso de bases de dados 
virtualmente ilimitadas. 


6.2 REPORTING BUILDER 


6.2 REPORTING BUILDER 195 


O Reporting Builder é uma ferramenta com a qual o usuário 
final desenvolve e publica seus próprios relatórios que ficarão 
disponíveis no SSRS. Deve-se dar a devida permissão para os 
usuários que farão a publicação por meio do Reporting Builder. Mas 
uma vez dada e de posse da ferramenta, pode-se dar aos power users 
a possibilidade de criar seus relatórios! 


Para tanto, vamos criar uma pasta no servidor que contemplará 
os relatórios feitos pelos usuários dentro de cada uma das pastas 
departamentais. Na página do Reporting Services, abriremos a pasta 

Comercial e, dentro dela, criaremos uma nova pasta chamada 
Relatórios de Usuários . Todos os relatórios publicados pelos 
usuários ficarão ali. Será nessa pasta que daremos acesso aos 
usuários paraa role chamada Construtor de Relatórios : 





trspo/Noçalhost Esparta PERD/Fsges pTi E Comert PP = O À 73 ew R 


Home Home | Sãe Settings | Hely 
ER SOL Server Reporting Services 
New Role Assignment E 


Use this page to define role-based security for Comercial 


Genup oi tatus mame [Nome do Usui) x 


Select ana ar mora rolas ta assign to lhe group ne user 


4 Description 
iz) Constmitos da Relatórios Poda exibir definições da relatórios 
Gerenciador de Conteudo Pode gerenciar o conteúdo do Servidor de Relatório Inclui pastas. relatórios e recursos 
Meus Relatórios Pode publicar relatórios e relatórios vinculados gerenciar pastas, relatórios e recursos na pasta Meus Relatórios de um usuária 
Navegador Pode axir pastas. relatórios e assinar relatórios. 
Publicador Pode publicar relatórios e relatósios vinculados no Servidor de Relatório 
cane 


Para adquirir o Reporting Builder, basta fazer o download 
(gratuito) em https://www.microsoft.com/pt- 
br/download/details.aspx?id=42301. Arquivo baixado, basta fazer a 
instalação nas máquinas de quem usará o recurso. Essa instalação é 
feita de forma simples, bastando clicar duas vezes sobre o instalador, 
clicar em Seguinte e aceitar o contrato de licenciamento. 


Depois disso, o instalador questionará sobre a URL de 
publicação, mas que podemos deixar em branco por hora. Clique 
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em Seguinte até o instalador iniciar a instalação e, ao final, abra o 
Reporting Builder: 





e 
f ON 90 j Untitled - Microsoft SQL Server Report Builder =x 














Ej Merge 





Nen dit A 
m O Built-in Fields 
E Parameters 

C Images 
[Ba Data Sources 
[a Datasets 





[&ExecutionTime] 

















O conceito é bastante parecido com o do Visual Studio. 
Possuímos DataSources que são as origens de dados, os 
Datasets que são os conjuntos de dados, e os parâmetros e as 
ferramentas que agora estão no ribbon acima. A interface é mais 
simplificada, mas pode-se criar relatórios bastante completos! 


Contudo, antes de iniciar, note que, no rodapé esquerdo do 
Reporting Builder, existe a notação de que ele não está conectado a 
nenhum servidor de relatórios. Para conectá-lo, basta colar a URL 
do nosso Reporting Services, mas alterando a palavra Reports 
para ReportServer ; dessa forma: 

http://NomeDoSeuServidor/Reportserver BIPRD. 


Se a conexão foi realizada, a informação terá alterado para: 
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Jo Current report server http://localhost/Reportserver BIPRD Disconnect 





Com essa interface, é possível criar os relatórios tal qual fizemos 
no Visual Studio. Contudo, o processo de publicação e as 
ferramentas de composição do relatório são mais simples e podem 
ser aprendidas por power users com muito menos esforço de 
treinamento que a versão completa do Visual Studio. 


6.3 POWER BI DESKTOP 


Dar mais e mais opções para que os usuários possam criar seus 
indicadores e suas análises é sempre uma boa forma de extrair ao 
máximo o que uma plataforma de BI pode oferecer. É bem verdade 
que os relatórios do Reporting Service não são simples para o 
usuário final, e que o Excel nem sempre oferece a melhor 
formatação de um dashboard! 


Mas, pensando nesse gap, em 2016 a Microsoft lançou o Power 
BI com diversos recursos, diversas ferramentas e “espalhado” em 
diversas plataformas. Tem-se o Power BI como ferramenta em 
Cloud, como um app para celular e, como veremos, um aplicativo 
desktop de criação de Dashboard bastante interessante. 


Pelo link https://powerbi.microsoft.com/pt-br/desktop/, você 
faz o download da ferramenta, bastando para isso preencher um 
cadastro com seu nome, e-mail e país. Feito o download, execute o 
instalador, aceitando o contrato de uso e selecionando o local de 
instalação. 
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A partir daí, o Power BI Desktop estará instalado e pronto para 
o uso. Ah, como você notou, ele é 100% gratuito e poderá ser 
mantido em seu ambiente mesmo com outra plataforma que não a 
SQL Server (ele possui conector para dezenas de origens de dados, 
inclusive Facebook, SalesForce, SAP BW, e diversos outros)! 


Executando o Power BI, a interface será a de um canvas em 
branco para a criação do seu dashboard, a caixa de ferramentas à 


direita e o ribbon acima com as opções contextualizadas. 





Clicando no botão obter Dados do ribbon, pode-se optar pelo 
SQL Server e fazer a conexão com o nosso DW (inserindo as 
informações de servidor e base de dados tal qual fizemos na Power 
Pivot). 


Novamente, selecione a nossa view vw AnaliseDw na lista de 
tabelas e visualizações que aparecerá e estaremos com o Power BI 
pronto para o uso! Usando as ferramentas de Visualizações e de 
Campos, é possível criar os gráficos e tabelas de forma simples e 
posicioná-los no canvas juntamente com filtros de página: 
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O Power BI pode ser usado offline, pois, ao criar um dashboard 
nele, é gerado um arquivo de extensão .pbix que pode ser 
reaberto, atualizado, enviado para outros usuários etc., bem como 
pode-se publicar no Portal do Power BI do Office 365, para acesso 
diretamente pelo browser. Entretanto, esse serviço é disponibilizado 
mediante a assinatura do 365. 


6.4 CONCLUSÃO 


Nossos dados saíram dos sistemas transacionais e foram postos 
no Data Warehouse! Deixaram de ser apenas dados e viraram 
informação. 


Informação que pode guiar as decisões de uma empresa, definir 
as ações de uma equipe, ou revelar comportamentos inesperados 
que implicam em erros ou até mesmo em fraudes! A utilização dessa 
plataforma, aliada à experiência de negócio de cada usuário, passa a 
gerar conhecimento! Esse conhecimento, por sua vez, torna a 
empresa mais focada, mais competitiva, mais integrada, com menos 
perdas. O conhecimento vira valor! 


E agregamos valor ao nosso negócio com um investimento 
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baixíssimo! Depois de discorrer sobre o passo a passo para 
implementar uma plataforma inteira de BI, sem a necessidade de 
licenciamentos milionários ou de “software assurance” anual, espero 
ter desfeito a visão de que Business Intelligence é para poucos, de 
que é caro ou complicado! 


É certo que o seu BI passa agora a ser um organismo vivo que 
receberá mais e mais importância, e mais e mais usuários estarão 
dependendo dele para as tarefas do dia a dia. Mais dimensões, mais 
fatos, mais visões. As limitações do que apresentamos neste livro em 
breve se farão sentir! 


O Data Warehouse começará a ficar grande e chegará ao limite 
máximo do SQL Server Express. O tempo de resposta dos relatórios 
poderá começar a crescer, funcionalidades adjacentes poderão se 
tornar relevantes, como exibições em dispositivos móveis, acessos 
por clientes que não estão na sua rede interna etc. 


Em algum momento no futuro, sua plataforma poderá 
necessitar de um “upgrade” para contemplar funcionalidades ou 
capacidades que apenas softwares pagos poderão fornecer. Antes de 
decidir por embarcar nessa nova fase da jornada, estude (mesmo!) 
as necessidades dos seus usuários, as funcionalidades de cada 
ferramenta e os conceitos acadêmicos que suportam cada 
tecnologia! 


Como quase todo o projeto de implantação de sistemas que 
presenciei ou tive conhecimento, o sucesso ou o fracasso da 
implantação, ou evolução de uma plataforma de um BI (e de outras 
disciplinas), está muito mais atrelado ao time, na competência e no 
comprometimento de cada um, do que nos softwares envolvidos. 
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